如何解决有没有办法用python编辑CSV文件中的列?
我正在尝试将大型CSV文件中的数据标准化。我想用不同的字符串“ Q35497”替换字符串“ Greek”,但只能在单个列中使用(我不想在每列中将单词“ Greek”的每个实例替换为“ Q35497”,而只是在一个列中命名为“ P407”)。这是我到目前为止所拥有的
data_frame = pd.read_csv('/data.csv') data_frame["P407"] = data_frame['P407'].astype(str) data_frame["P407"].str.replace('Greek','Q35497')
但这只是创建带有字符串列表(例如“ Q35497”)的单列“ P407”,而我不能将其附加到整个csv表中。
我尝试使用DataFrame.replace
data_frame = data_frame.replace( #to_replace={"P407":{'Greek':'Q35497'}},#inplace=True #)
但这只会创建一个空集。我也不知道为什么data_frame [“ P407”]创建了一个单独的系列,无法添加到原始csv文件中。
解决方法
您的方法是正确的,但是缺少存储修改后的数据框的方法。
data_frame = pd.read_csv('/data.csv')
data_frame["P407"] = data_frame["P407"].str.replace('Greek','Q35497')
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。