如何解决在一行中按字数对字符串向量进行子集化 数据
我有一个字符串向量
rownames
[1] "multifarmacias descuento" "multifarmacias" "multifarmacias"
我的目标是通过仅包含一个单词的字符串将rownames
排成一行,结果将是
[1] "multifarmacias" "multifarmacias"
我尝试了以下操作,但会引发错误:
rownames[which(sapply(strsplit(rownames," "),length)) == 1]
Error in which(sapply(strsplit(rownames,length)) :
argument to 'which' is not logical
是否有一种优雅的解决方案,可以根据字符串的字长来替换字符串向量?
解决方法
使用str_count
library(stringr)
rownames[str_count(rownames,"\\w+") == 1]
#[1] "multifarmacias" "multifarmacias"
如果我们将strsplit
与{{1}一起使用lengths
,则效率更高
base R
OP帖子中的错误是基于rownames[lengths(strsplit(rownames,"\\s+")) == 1]
#[1] "multifarmacias" "multifarmacias"
的错误放置,它应该在)
之后,因为==1
直接应用于长度为矢量的向量,即
which
其中((c(2,1,1)):错误的参数是不合逻辑的
数据
which(c(2,1,1))
,
base R
解决方案是:
#Data
x <- c("multifarmacias descuento","multifarmacias","multifarmacias")
#Code
x[which(lapply(strsplit(x,split = ' '),length)==1)]
输出:
[1] "multifarmacias" "multifarmacias"
,
这是使用grep
grep("\\s",rownames,invert = TRUE,value = TRUE)
给出
> grep("\\s",value = TRUE)
[1] "multifarmacias" "multifarmacias"
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。