如何解决基于分组计数的过滤器
> diamonds %>% group_by(color) %>% tally %>% arrange(desc(n))
# A tibble: 7 x 2
color n
<ord> <int>
1 G 11292
2 E 9797
3 F 9542
4 H 8304
5 D 6775
6 I 5422
7 J 2808
我想过滤钻石以排除总计数小于6K的所有组。
我当时想我可以按nest()
然后按unnest()
进行分组,但想知道是否有使用窗口函数进行过滤的代码更简洁一些?我正在阅读文档here,但无法立即看到一种基于组计数进行过滤的方法。
由于I和J的总计数均小于6K,我该如何过滤钻石以排除包含I或J的行?
解决方法
我们可以在分组步骤之后直接使用filter
library(dplyr)
diamonds %>%
group_by(color) %>%
filter(n() > 6000)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。