如何解决如何获取r中多个组的平均SD和Pvalue?
你好我所有的数据框看起来像
category calss test1 test2
1 Yes 5.5 4.2
1 No 5.8 4.3
1 Yes 6.6 3.2
2 Yes 6 7.7
2 No 5.7 5.8
3 No 9.7 4.5
3 Yes 6.8 8.5
2 No 6.3 9.6
3 Yes 8.5 2.6
我想分别基于类和类别来计算(在test1和test2之间)的平均SD和Pvalue
我使用dplyr来计算均值和SD,并努力计算Pvalue,因为我的数据集包含1000行和4个不同的类别和8个类
这是使用dplyr表示均值和标准差后得到的结果
category class test1_Mean test1_SD test2_Mean test2_SD
1 Yes 6 1 3.7 1.1
1 No 5.8 0 4.3 0
2 Yes 9.6 0 4.4 0
2 No 6 1.1 7.7 1
3 Yes 7.6 0.5 5.5 0.8
3 No 9.7 0 4.5 0
并且SD只是手动输入,以显示我想要的输出不要介意它的错误值
category class test1_Mean test1_SD test2_Mean test2_SD Pvalue
1 Yes 6 1 3.7 1.1 0.05
1 No 5.8 0 4.3 0 0.14
2 Yes 9.6 0 4.4 0 0.69
2 No 6 1.1 7.7 1 0.001
3 Yes 7.6 0.5 5.5 0.8 2.00E+05
3 No 9.7 0 4.5 0 0.04
预先感谢
解决方法
您可以尝试:
library(dplyr)
df %>%
group_by(category,calss) %>%
summarise(pvalue = t.test(test1,test2)$p.value)
,
我认为这是您想要的:
library(dplyr)
df %>% group_by(category,class) %>%
summarise(test1_mean=mean(test1),test2_mean=mean(test2),test1_SD=sd(test1),test2_SD=sd(test2),pvalue = t.test(test1,test2)$p.value)
,
带有data.table
library(data.table)
setDT(df)[,.(pvalue = t.test(test1,test2)$p.value),.(category,calss)]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。