方差分析中的泊松残差检验

如何解决方差分析中的泊松残差检验

我尝试找到任何方法来测试Poisson残差，例如aov()中的法线。在我的假设示例中：

# For normal distribution
x <- rep(seq(from=10,to=50,by=0.5),6)
y1 <- rnorm(length(x),mean=10,sd=1.5)

#Normality test in aov residuals
y1.av<-aov(y1 ~ x)
shapiro.test(y1.av$res)
#   Shapiro-Wilk normality test
#
#data:  y1.av$res
#W = 0.99782,p-value = 0.7885

听起来很傻，好吧！

现在，除了泊松分布外，我想采用相同的方法

# For Poisson distribution
x <- rep(seq(from=10,6)
y2 <- rpois(x,lambda=10)

#Normality test in aov residuals
y2.av<-aov(y2 ~ x)
poisson.test(y2.av$res)
Error in poisson.test(y2.av$res) : 
  'x' must be finite,nonnegative,and integer

有什么统计方法可以做到这一点？

谢谢！

解决方法

您可以在计数上下文下分析数据。离散数据（例如泊松性质的变量）可以基于观测到的频率进行分析。您可以为此任务制定假设检验。作为数据y，您可以将y遵循带有一定参数lambda的Poisson分布的原假设与y不是来自Poisson分布的假设进行对比。让我们用数据来勾画测试：

#Data
set.seed(123)
# For Poisson distribution
x <- rep(seq(from=10,to=50,by=0.5),6)
y2 <- rpois(x,lambda=10)

现在，我们获得了计数，这是测试的基本要素：

#Values
df <- as.data.frame(table(y2),stringsAsFactors = F)
df$y2 <- as.integer(df$y2)

此后，我们必须分离观察值O及其组或类别classes。这两个元素都构成y变量：

#Observed values
O <- df$Freq
#Groups
classes <- df$y2

在测试泊松分布时，必须计算lambda参数。这可以通过最大似然估计（MLE）获得。泊松的MLE是平均值（考虑到我们有计数和组以确定该值），因此我们用下一个代码对其进行计算：

#MLE
meanval <- sum(O*classes)/sum(O)

现在，我们必须获取每个类的概率：

#Probs
prob <- dpois(classes,meanval)

泊松分布可以取无穷大的值，因此我们必须计算出可能大于上一组值的概率，以使概率之和为一：

prhs <- 1-sum(prob)

可以很容易地将此概率添加到我们组的最后一个值，以便进行变换以说明大于或等于该值的值（例如，我们可以仅用y等于20的概率y大于或等于20）的可能性：

#Add probability
prob[length(prob)]<-prob[length(prob)]+prhs

这样，我们可以使用chisq.test()中的R函数进行拟合优度测试。它需要观测值O和我们计算出的概率prob。提醒您，此测试用于设置错误的自由度，因此我们可以通过制定使用k-q-1度的测试来对其进行更正。其中k是组数，q是计算的参数数（我们已经使用MLE计算了一个参数）。接下来的测试：

chisq.test(O,p=prob)

输出：

Chi-squared test for given probabilities

data:  O
X-squared = 7.6692,df = 17,p-value = 0.9731

测试的关键值是X-squared值，它是测试统计量。我们可以重用该值以获得实数p-value（在我们的示例中，我们有k=18减去负2，自由度为16）。

p.value可以通过以下代码获得：

p.value <- 1-pchisq(7.6692,16)

输出：

[1] 0.9581098

由于该值不大于已知的显着性水平，因此我们不会拒绝原假设，并且可以确认y来自泊松分布。

方差分析中的泊松残差检验

如何解决方差分析中的泊松残差检验

解决方法

相关推荐