如何解决如何读取其他格式的文件格式?例如-以CSV格式保存
因此,在我的工作中,我们必须使用.sav文件(SPSS文件)。原因是出于标准化目的。 我很好奇我是否可以将SPSS / .sav文件作为csv读取到熊猫中并从本质上绕过将其作为sav读取?
例如,当我读入文件然后转换为csv时,我通常会这样做:
df = pd.read_spss('filepath.sav')
df.to_csv('filepath.csv')
df = pd.read_csv('filepath.csv')
这是非常无效且缓慢的,因为读取.sav文件是一个缓慢/耗时的过程。
所以我想知道的是,我可以先将.sav文件读取为.csv文件吗,而无需先将其作为.sav文件读取吗?
解决方法
您可能对this topic感兴趣。简而言之,它指向C库ReadStat的包装,该包装比熊猫更快地读取SPSS文件。
其GitHub存储库的链接为https://github.com/Roche/pyreadstat
,pd.read_spss是否不像pd.read_csv一样返回数据框?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。