如何解决如何预测测试集?
我正在逐步跟踪Kaggle的课程部分。有些事情我无法弄清楚。.我试图预测我的模型,但是它不起作用,我搜索了一些主题,但是找不到有用的东西..这是代码的最后一部分;
> df
ID val1 sig1 val2 sig2 val3 sig3 first_val first_val_value
1 ID1 0 0.76 0.25 0.65 0.26 0.64 - -
2 ID2 1 0.15 0.81 0.09 0.24 0.62 val1 1
3 ID3 0 0.35 0.21 0.55 0.16 0.65 val1 0
4 ID4 0 0.66 0.06 0.88 -0.10 0.80 - -
5 ID5 0 0.70 0.18 0.09 0.22 0.04 val2 0.18
6 ID6 0 0.72 NA NA NA NA - -
一键编码删除索引;放回去
final_encoder =OneHotEncoder(handle_unknown='ignore',sparse=False)
final_X_train = pd.DataFrame(final_encoder.fit_transform(X_train[low_cardinality_cols]))
final_X_valid = pd.DataFrame(final_encoder.transform(X_valid[low_cardinality_cols]))
删除分类列(将替换为一键编码)
final_X_train.index =X_train.index
final_X_valid.index =X_valid.index
将一键编码列添加到数字特征
num_X_train = X_train.drop(object_cols,axis=1)
num_X_valid = X_valid.drop(object_cols,axis=1)
直到这里没有问题..但是当我运行这部分时;
final_2_X_train =pd.concat([num_X_train,final_X_train],axis=1)
final_2_X_valid =pd.concat([num_X_valid,final_X_valid],axis=1)`
我遇到了错误:: final_X_test =pd.DataFrame(final_encoder.transform(X_test))
preds_test = final_X_test`
我在github和stackoverflow上搜索的东西也没有用..知道吗? 顺便说一句,如果您想查看完整的代码:https://www.kaggle.com/ugurlumucahit/exercise-categorical-variables
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。