如何解决对新数据使用预测时出错 - 因子具有新水平
我从一些训练数据构建了一个线性回归模型,然后尝试使用 predict
函数来预测测试数据集的值,但是当我这样做时,我收到以下错误消息:
Error in model.frame.default(Terms,newdata,na.action = na.action,xlev = object$xlevels) : factor Overall.Qual has new levels 1,2,3
我在其他线程中读到发生这种情况是因为测试数据集中的变量的级别未包含在模型中,但是当我使用“摘要”函数检查时,该变量具有相同的级别数训练集和测试集。
这是训练数据集的摘要输出:
1 2 3 4 5 6 7 8 9 10
1 5 9 58 268 209 168 88 24 4
这是测试数据集的输出:
1 2 3 4 5 6 7 8 9 10
1 2 12 63 214 234 171 96 19 5
但是,如果我使用 full_model$xlevels
检查模型中实际包含的级别,似乎它正在降低模型中的级别 1,2 和 3。我理解它下降了 1 级,因为它只有一个数据点,但我真的很困惑为什么它下降了其他两个级别。谁能解释一下?有没有更好的方法来修复它,而不仅仅是从测试数据集中删除这些级别?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。