如何解决R 如果三个或更多值是 NA,则删除行
我觉得我应该能够使用过滤器或子集来做到这一点,但不知道如何做。
如果一行中的三个或更多单元格是“NA”,我如何删除该行?
因此在此数据集中,标题为 1A-C2 和 3A-C2 的行将被删除。
my_data <- data.frame(Title = c("1A-C2","1D-T2","1F-T1","1E-C2","3A-C2","3F-T2"),Group1 = c(NA,10,2,9,NA,4),Group2 = c(1,3,6,1,3),Group3=c(NA,8,Group4=c(NA,4,5,7),Group5=c(1,NA),Group6=c(NA,NA))
谢谢!!
解决方法
使用Base R
,
my_data[rowSums(is.na(my_data))<3,]
给予,
Title Group1 Group2 Group3 Group4 Group5 Group6
2 1D-T2 10 3 3 NA 4 4
3 1F-T1 2 6 3 4 3 5
4 1E-C2 9 1 8 5 3 6
6 3F-T2 4 3 4 7 NA NA
,
使用dplyr
:
library(dplyr)
my_data %>%
rowwise() %>%
filter(sum(is.na(c_across(starts_with('Group')))) < 3)
# Title Group1 Group2 Group3 Group4 Group5 Group6
# <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#1 1D-T2 10 3 3 NA 4 4
#2 1F-T1 2 6 3 4 3 5
#3 1E-C2 9 1 8 5 3 6
#4 3F-T2 4 3 4 7 NA NA
,
在base R
中,我们可以将Reduce
与is.na
结合使用
subset(my_data,Reduce(`+`,lapply(my_data[startsWith(names(my_data),"Group")],is.na)) < 3)
# Title Group1 Group2 Group3 Group4 Group5 Group6
#2 1D-T2 10 3 3 NA 4 4
#3 1F-T1 2 6 3 4 3 5
#4 1E-C2 9 1 8 5 3 6
#6 3F-T2 4 3 4 7 NA NA
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。