如何解决在特征提取中使用交叉验证的正确方法是什么
我尝试使用交叉验证,但我不知道这是否正确 我将值分成两部分
然后我在 PCA 中使用 X 特征值,然后在交叉验证函数中使用 PCA 的输出(特征)。
from sklearn.decomposition import PCA
from sklearn.ensemble import RandomForestClassifier
df = pd.read_csv('data.csv')
X = df.drop(['label'],axis = 1) Y = df['label']
pca = PCA(n_components=6) X_pca = pca.fit_transform(X)
model = RandomForestClassifier(n_estimators =400)
cv = StratifiedKFold(n_splits=5,random_state=123,shuffle=True)
n_scores = cross_val_score(model,pca,Y,scoring='accuracy',cv=cv,n_jobs=-1,error_score='raise')
print('Accuracy: %.3f (%.3f)' % (mean(n_scores),std(n_scores)))
尤其是这部分:
n_scores = cross_val_score(model,score='accuracy',error_score='raise')
(pca) 和 (y) 参数是否在正确的位置?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。