如何解决字典向量中字符串的查找位置
我的数据格式如下。
dictionary<-c("a","the","we","is","hello")
text<-vector(mode="list",length=2)
text[[1]]<-c("we","hello","relative")
text[[2]]<-c("because","is")
[[1]]
[1] "we" "hello" "relative"
[[2]]
[1] "because" "is" "the"
我想在字典中查找文本中每个单词的位置,并创建一个标记化的文本列表,如下所示:
token.text<-vector(mode="list",length=2)
token.text[[1]]<-c(3,5,0)
token.text[[2]]<-c(0,4)
[[1]]
[1] 3 5 0
[[2]]
[1] 0 4
我的数据当然要大得多。我的字典相对较小(2000字),但文本列表很大。我敢肯定有一个简单的解决方案,但是我在这里很茫然。
解决方法
我们可以使用match
lapply(text,match,table = dictionary,nomatch = 0)
#[[1]]
#[1] 3 5 0
#[[2]]
#[1] 0 4
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。