如何解决如何在 R 中运行双交叉分类的 3 级分层线性模型? HLM 中的 DIF
我正在尝试一种新颖的分层线性模型,但数据结构让我怀疑这在 R 中是否可行。我之前对模型的尝试被错误地指定(哎呀),现在我不知道如何处理这件作品。我的 HLM 课程涵盖了多级模型和交叉分类模型,但不包括 3 级双交叉分类模型。
级别 1:
- 对二分计分项目的回应。绝对依赖
变量,所以我想我将使用
glmer()
。 (约 150 万条回复)
级别 2:
- 响应嵌套在项目中 - 一个项目将有许多响应 (来自不同的人),但一个单一的回应不会链接到 多个项目。
- 响应也嵌套在测试实例中 - 一个测试实例将有许多响应 (50),但一个响应不能链接到多个测试实例。
- 项目不嵌套在测试实例中,而测试实例不嵌套在项目中。一个项目将出现在多个测试实例中(每次有人参加表格 A 时),一个测试实例将与多个项目相关(测试表格上的每个项目)。
级别 3:
- 项目嵌套在测试表单中 - 一个表单上可以有多个项目,但(在这种情况下)项目不能出现在多个表单上。
- 测试实例嵌套在人中 - 一个人可以参与多个测试实例,但一个测试实例不能由多人执行。
- 测试实例也嵌套在位置中 - 一个位置可以有多个测试实例,但一个测试实例不能出现在多个位置
- 测试表单不嵌套在人中,人不嵌套在测试表单中。一个人可以参加多个测试表格,一个测试表格可以由多人参加。
- 人不嵌套在位置内,位置不嵌套在人内 - 一个人可以在多个位置进行测试,几个人可以在一个位置进行测试位置。
- 测试表单不嵌套在位置中,位置不嵌套在测试表单中 - 一个测试表单可以在多个位置使用;一个位置可用于管理许多测试表格。
我假设某些位置变量可能会对特定项目的表现产生影响,但我认为这会受到参加测试者的能力等因素的影响。我有兴趣探索的地点、学生和项目级别的解释变量,例如噪音水平、GPA 和主题。
如果您有任何问题或建议,请告诉我。
解决方法
我不明白为什么这是一个问题。 “现代”混合模型框架,如 R 中可用的大多数框架(nlme
、lme4
、glmmTMB
等)不包含(或要求)任何明确的嵌套声明;它们只要求您指定定义每个分组变量的因素。我不明白为什么
(1|student) + (1|location) + (1|instance) + (1|item) + (1|form)
行不通。有几件事情需要考虑,我不知道您的问题中是否出现了其中任何一项:
- 如果您的回答是二元的,您需要确保您没有随机效应,即每个观察都属于一个单独的随机效应组(这种变化水平是无法识别的)。例如,如果每个学生在每个地点最多回答一次问题(即没有人在一个地点参加测试超过一次,并且他们每次测试从不超过一次回答问题),那么任何给定的学生/项目/location 组合将在您的数据集中出现零次或一次,并且
(1|location:student:item)
的方差将无法识别。 - 在某些情况下,您的变量之间的相互作用可能是可识别的(例如,测试项目的难度是否因地点而异?);这可以指定为
(1|location:item)
,但您必须小心一点,您的交互级别不会唯一标识观察结果(请参阅上一点)
您可能会发现 GLMM 常见问题解答很有用,尤其是 this section ...
PS 我绝对建议您对原始数据的一个子集进行试验(glmer
肯定可以实现 150 万个项目,但速度会很慢......);您可能还想指定 control=glmerControl(calc.derivs=FALSE)
以跳过一些(缓慢的)诊断检查
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。