如何解决H2o XGBOOST 变量重要性
我在带有 Xgboost
的数据集上使用 H2o
构建了一个 ~4MM rows and ~7k columns
模型。当我将变量重要性导出到 CSV 文件时,我只有大约 3k attributes
。
这是否意味着 H2o 会自动删除那些重要性为 0 的变量?
xgbm_quick = H2OXGBoostEstimator(model_id = model_id,**hyperparams_new)
xgbm_quick.train(x = x,y = y,training_frame = train_data,validation_frame = validation_data,weights_column = wgt_col)
pd.DataFrame(xgbm_quick.varimp()).to_csv(os.path.join(results_output_dir,model_id +"_varimp.csv"),index=False)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。