如何解决使用T分隔带有不同组数的字符串的正则表达式在Tidyr中提取函数的方法?
我正在将R的excel文件读入R,这些文件具有与其标识相关的不同文件名。其中一些文件名仅由其他文件中不存在的最终组标签来区分。
当我尝试使用tidyr的extract()函数根据姓氏分离文件时,我也无法解析其他条件。
例如,使用以下文件名: “ Name1 Name2”和“ Name1”
d<-extract(d,filename,c("col1","col2"),"(.*) (.*)",remove=FALSE)
导致返回的值 col1 =“ Name1”,而col2 =“ Name2”,第一个文件名,NA为第二个文件名
使用以下正则表达式:
(.*)(| .*)
返回col1中的文件名给出col2的NA。
我如何将它们分为不同的列?
如果在某种程度上使Name2变得更容易,那么Name2始终是空格后的完全相同的名称。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。