如何解决如何识别不符合条件的网站?
如何从一个数据框中选择不满足另一个数据框中特定条件的网站?
在我的示例中,我有两个站点(1和2),它们具有与之关联的变量(a,b,c和d)。但是,站点2缺少变量c和d。
Site = c(1,1,2,2),variable = c('a','b','c','d','a','b'))
我对查找缺少一组已定义变量的网站感兴趣。我选择的变量在这里:
sel <- data.frame(variable = c('a','c'))
我正试图得到这个:
Site variable
2 c
解决方法
对于每个site
,您可以complete
丢失variable
的组合,并使用anti_join
和原始df
来获取丢失的那些。
library(dplyr)
df %>%
tidyr::complete(Site,variable = sel$variable) %>%
anti_join(df)
# Site variable
# <dbl> <chr>
#1 2 c
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。