如何解决如何在交叉验证中使用.fit
我对数据科学还很陌生,有点困惑。 并且只是想确保我的方法有意义。
我创建如下模型:
lr7 = GaussianNB().fit(X_train,y_train)
,然后紧接着使用cross_val_predict()。
y_pred8 = cross_val_predict(lr8,X_test,y_test,cv=5,n_jobs=-1,verbose=5)
首先交叉验证火车组是否更有意义?
scikitlearn中还有一个cross_validate()
功能。
将此与火车数据集一起使用是否正确?在文档中,他们同时使用X和y,而不训练/测试分割后的数据。
解决方法
实现交叉验证的一种简单方法是使用cross_val_score
函数(来自sklearn。这可能适合您的问题。
# build model
lr7 = GaussianNB()
scores = cross_val_score(lr7,X,y,cv=5)
请注意,在交叉验证中,您可以使用整个数据集,也可以使用训练部分X_train
,y_train
,而不使用代码中显示的测试部分。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。