如何解决R摘要不会从联接结果中删除重复项
我试图在r中联接两个表,但是尽管我使用了summarise(),但最终还是出现了一些重复。
注释: 我已经尝试过右,左和内联接
parent_id
提前谢谢!
解决方法
summarize
动词在您group_by()
之后计算合计。这是正确使用摘要的示例。
library(dplyr)
df1 <- data.frame(x = rep(c("Ag","Ag","Be","Mo","Mo"),2),y = rep(c("A","B","A","B"),2))
df1 %>%
group_by(x,y) %>%
summarize(count = n())
# A tibble: 6 x 3
# Groups: x [3]
x y count
<chr> <chr> <int>
1 Ag A 2
2 Ag B 2
3 Be A 2
4 Be B 2
5 Mo A 2
6 Mo B 2
您也可以使用distinct()
中的dplyr
删除重复项,或者也可以使用unique()
中的简单任务base
删除重复项。
df1 %>%
distinct()
x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B
df1 %>%
unique()
x y
1 Ag A
2 Ag B
3 Be A
4 Be B
5 Mo A
6 Mo B
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。