如何解决lm和cor之间的比较-为什么结果不对应
我正在对我的数据集(例如数据帧df)进行分析:
DOY species replicate position SLA PAR temp A1200 susPQ susNPQ FvFm
1: 46 LINGONBERRY 1 LOW 65.75638 19.70906 -2.850833 0.569690 2.147297 0.9321771 0.5263661 562.1016 0.011440 28.02628
2: 46 LINGONBERRY 2 LOW 59.45028 19.78096 -2.850833 0.893840 2.511543 1.0516496 0.5503916 533.6136 0.028930 25.40703
3: 46 LINGONBERRY 3 LOW 59.51058 17.52833 -2.850833 0.731765 2.278927 1.0678274 0.5242824 549.6316 0.020185 46.16188
4: 46 PINE 1 LOW 35.90156 20.85151 -2.850833 1.518910 2.319431 2.2168853 0.4189484 392.6067 0.059280 47.79101
5: 46 PINE 1 TOP 27.29495 90.27197 -2.850833 1.780420 1.739912 1.5691443 0.4037803 418.3636 0.032890 59.03595
6: 46 PINE 2 LOW 34.38626 27.86268 -2.850833 1.959910
我想检查变量之间的相关性,因此我使用了cor()
和rcor()
函数。
cor.df <-corrplot(cor(df[,c(1,5:19)],method = "pearson"),method = "number",type = "upper",tl.col = "black")
df_matrix <- as.matrix(df[,5:19)])
rcor.df <- rcorr(df_matrix,type ="pearson")
cor.df_R <-corrplot(rcor.df$r,tl.col = "black",p.mat = rcor.df$P,sig.level = 0.001)
r-correlation plot for my variables with "unsignificant" correlations crossed
由于结果不是我期望的,我想再次检查该方法是否有效。为了测试这一点,我想简单地将一些变量对放入lm()
中。我的假设是,lm()
摘要中的R2应该与我的corplot
中传递的值相同。但是,事实并非如此。
1 /我的假设有什么问题?为什么lm()
R2不对应于rcor()
或cor()
r?
2 /什么是合适的测试来检查我在corplot
中传递的相关性是否可信?如果我们的结果显示出与文献相抵触的情况(在这种情况下),那么最好进行备份测试。
解决方法
简单线性回归的R²不是相关性,而是独立变量和因变量之间的相关性的平方。
x <- 1:5
y <- rnorm(5)
cor(x,y)^2
# 0.001016668
summary(lm(y ~ x))$r.squared
# 0.001016668
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。