如何解决如何使用R中的MICE包来估算丢失的数据?
我有一个关于2000个观测值的数据集,以进行进一步的分析。有4个变量的缺失值很多(缺失百分比超过50%)。我正在尝试使用MICE包来估算缺失值。这是我的问题:
-
对于最终数据集,它包含先前来自不同数据集的变量。我应该使用最终数据集来估算这些变量的缺失值,还是应该使用原始数据集(这四个变量来自何处),而原始数据集的数据与这四个变量更相关?
-
我在网上看到了两个不同的代码:
imputed_Data <- mice(iris.mis,m=5,maxit = 50,method = 'pmm',seed = 500)
completeData <- complete(imputed_Data,2)
另一个:
mice(anesimp2,maxit = 5,predictorMatrix = predM,method = meth,print = FALSE)
我想知道这两个代码之间有什么区别,应该使用哪一个。如果使用第一个代码,我也想知道在我的情况下应该设置种子的什么值。
- 在运行这些代码之前,我应该对数据进行任何预处理吗?
非常感谢您的帮助!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。