如何解决Python/pyspark:将 h20 数据帧作为数组传递给 sklearn kneighbors
我有一个 h20 框架,我需要将它传递给 sklearn kneighbors (NearestNeighbors),如果我没有错,“from sklearn.neighbors import NearestNeighbors”只接受数组,我尝试了一行,它正在工作。但是,如何将 who h20 daframe 传递给该函数?我想我可以使用 for 循环,但想知道还有其他有效的方法。仅供参考 - 我正在使用 pyspark 进行实现
from sklearn.neighbors import NearestNeighbors
h20_df_mod_output = model_name(input_Dataset)
neigh = NearestNeighbors(n_neighbors=1)
neigh.fit(centroid_values['centroids'])
distance,indices = neigh.kneighbors([h20_df_mod_output[1,:]]) # How can I pass the entire dataset here?
解决方法
我相信 Scikit-Learn 的算法不接受 H2O 帧。因此,您可以通过执行以下操作将 H2O 帧转换为 Pandas 数据帧:
pandas_frame = h2o_frame.as_data_frame()
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。