如何解决如何计算热顿随机森林的训练数据与测试数据之间的准确性
我建立了一个随机森林模型,并用它来预测我的训练和测试数据,这些数据来自两个不同的数据帧。
我想计算模型的准确性,但是它没有用,因为我的训练数据只有76行,而测试数据只有52行。
如何在python中制作它?
到目前为止,我所做的是尝试使用以下命令打印准确性:
print("Accuracy:",metrics.accuracy_score(y_pred_test,y_pred_train))
它给了我以下错误:
找到输入样本数量不一致的输入变量:[52,76]
解决方法
metrics.accuracy_score()
函数状态的sklearn文档
精度分类得分。 在多标签分类中,此函数计算子集准确性:为样本预测的标签集必须与y_true中的相应标签集完全匹配。
因此,当y_true
== y_pred
的形状时,应严格使用此功能。
相反,您可以使用model.score()
方法。您将不得不使用该功能两次,一次用于测试,一次用于火车。例如:
from sklearn.ensemble import RandomForestClassifier
rf_classifier = RandomForestClassifier(n_estimators=200)
rf.fit(X_train,y_train)
print(f'Final Training Accuracy: {rf.score(X_train,y_train)*100}%')
print(f'Model Accuracy: {rf.score(X_test,y_test)*100}%')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。