如何解决尝试使用 pyspark 将文件从我的电脑导入到在 AWS 中运行的 Zeppling
我正在尝试使用 AWS 中的 Zeppeling 读取数据(.h5 文件),但这是不可能的。我尝试了以下代码:
%pyspark
df = pd.read_hdf(r"C:\path\file_name_5",'table')
我得到的错误是: “NotImplementedError:尚未实现对通用缓冲区的支持。”
我已经导入了 Pandas。
我做错了什么?
我也尝试从 S3 导入它,但它似乎不支持 hdf 格式。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。