如何解决使用dplyr按变量分组的R中的加权平均值
所以我有一个这样的df:
数据
structure(list(ID = 1:12,Team = c(1L,2L,1L,2L),DOW = c("Monday","Monday","Tuesday","Wednesday","Thursday","Monday"),Hrs = c(11858L,1338L,13282L,2188L,15831L,858L,34858L,10000L,1000L,23320L,23000L)),class = "data.frame",row.names = c(NA,-12L))
ID Team DOW Hrs
001 1 Monday 11858
002 2 Monday 1338
003 1 Tuesday 13282
004 2 Tuesday 2188
005 1 Wednesday 15831
006 2 Wednesday 858
007 1 Thursday 34858
008 2 Thursday 10000
009 1 Monday 1000
010 2 Tuesday 23320
011 1 Tuesday 1000
012 2 Monday 23000
让我们将每一行称为事件。
因此,我想计算一周中每一天的事件发生率。我也想基于Team
来做到这一点。
使用以下信息,我可以生成平均值
df %>%
group_by(Team,DOW) %>%
summarize(count = n(),hrs = sum(Hrs)) %>%
mutate(incRate = count/hrs) %>%
如何准确地将其作为加权平均值。我需要两个不同的加权平均值。
- 加权平均数,同时考虑到两个球队
- 仅考虑适当团队的加权平均值。
因此,对于2,这将仅是其平均团队1数据和其平均团队2的加权平均值。
简而言之,我想添加2个变量,它们将是加权平均值。
最后我想使用以下内容进行绘制:
ggplot(df,aes(y=incRate,x=as.factor(Day.of.Week),color=FRA.Reportable,group=FRA.Reportable)) +
geom_line() +
labs(x = "Day of the Week",y = "IncRate",fill = "") +
scale_color_manual(values = c("darkorange","cornflowerblue") ) +
theme_hc() +
theme(axis.text.x=element_text(angle = 45))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。