如何解决方差分析中的泊松残差检验
我尝试找到任何方法来测试Poisson残差,例如aov()
中的法线。在我的假设示例中:
# For normal distribution
x <- rep(seq(from=10,to=50,by=0.5),6)
y1 <- rnorm(length(x),mean=10,sd=1.5)
#Normality test in aov residuals
y1.av<-aov(y1 ~ x)
shapiro.test(y1.av$res)
# Shapiro-Wilk normality test
#
#data: y1.av$res
#W = 0.99782,p-value = 0.7885
听起来很傻,好吧!
现在,除了泊松分布外,我想采用相同的方法
# For Poisson distribution
x <- rep(seq(from=10,6)
y2 <- rpois(x,lambda=10)
#Normality test in aov residuals
y2.av<-aov(y2 ~ x)
poisson.test(y2.av$res)
Error in poisson.test(y2.av$res) :
'x' must be finite,nonnegative,and integer
有什么统计方法可以做到这一点?
谢谢!
解决方法
您可以在计数上下文下分析数据。离散数据(例如泊松性质的变量)可以基于观测到的频率进行分析。您可以为此任务制定假设检验。作为数据y
,您可以将y
遵循带有一定参数lambda的Poisson分布的原假设与y
不是来自Poisson分布的假设进行对比。让我们用数据来勾画测试:
#Data
set.seed(123)
# For Poisson distribution
x <- rep(seq(from=10,to=50,by=0.5),6)
y2 <- rpois(x,lambda=10)
现在,我们获得了计数,这是测试的基本要素:
#Values
df <- as.data.frame(table(y2),stringsAsFactors = F)
df$y2 <- as.integer(df$y2)
此后,我们必须分离观察值O
及其组或类别classes
。这两个元素都构成y
变量:
#Observed values
O <- df$Freq
#Groups
classes <- df$y2
在测试泊松分布时,必须计算lambda参数。这可以通过最大似然估计(MLE)获得。泊松的MLE是平均值(考虑到我们有计数和组以确定该值),因此我们用下一个代码对其进行计算:
#MLE
meanval <- sum(O*classes)/sum(O)
现在,我们必须获取每个类的概率:
#Probs
prob <- dpois(classes,meanval)
泊松分布可以取无穷大的值,因此我们必须计算出可能大于上一组值的概率,以使概率之和为一:
prhs <- 1-sum(prob)
可以很容易地将此概率添加到我们组的最后一个值,以便进行变换以说明大于或等于该值的值(例如,我们可以仅用y
等于20的概率y
大于或等于20)的可能性:
#Add probability
prob[length(prob)]<-prob[length(prob)]+prhs
这样,我们可以使用chisq.test()
中的R
函数进行拟合优度测试。它需要观测值O
和我们计算出的概率prob
。提醒您,此测试用于设置错误的自由度,因此我们可以通过制定使用k-q-1
度的测试来对其进行更正。其中k
是组数,q
是计算的参数数(我们已经使用MLE计算了一个参数)。接下来的测试:
chisq.test(O,p=prob)
输出:
Chi-squared test for given probabilities
data: O
X-squared = 7.6692,df = 17,p-value = 0.9731
测试的关键值是X-squared
值,它是测试统计量。我们可以重用该值以获得实数p-value
(在我们的示例中,我们有k=18
减去负2,自由度为16)。
p.value
可以通过以下代码获得:
p.value <- 1-pchisq(7.6692,16)
输出:
[1] 0.9581098
由于该值不大于已知的显着性水平,因此我们不会拒绝原假设,并且可以确认y
来自泊松分布。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。