如何解决R - 正则表达式来分割不同长度的字符串
我有一个 df,它有一列 (Synopsis
) 包含字符串。这些字符串中的一些(但不是全部)以数字结尾(有时只有一位数,有时是两位数,有时是三位数),后跟单词“分钟”。例如:
“此处的示例 1 文本 59 分钟”
“2/3 更多示例文本 120 分钟”
注意最后一个数字前没有空格。我想将这些字符串分成两列,新列(我们称之为 Duration
)包含以下信息:
“59 分钟”
“120 分钟”
我知道我需要使用正则表达式来做到这一点,但鉴于“分钟”之前的数字长度不同,我不确定如何解决这个问题。我有什么想法可以做到这一点吗?
明确地说,这个答案对我不起作用:Add a space between number and word R
这是因为数字经常出现在字符串的前面。我只是想识别以“mins”结尾的字符串,然后将其 + 前面的 1/2/3 位数字拆分为一个新列。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。