如何解决熊猫:遍历列表以匹配数据框中的值
我正在使用美国所有县的covid计数数据框。我想出了如何隔离一个县并将结果导出到csv的方法:
import pandas as pd
covid = pd.read_csv('https://raw.githubusercontent.com/nytimes/covid-19-data/master/us-counties.csv')
agh = covid[covid['county'] == 'Allegheny']
agh.to_csv('AlleghenyCovid.csv')
现在我要创建一个这样的县列表:
countyList = covid.county.unique()
并遍历它们为每个创建一个csv。那就是我被困住的地方。如何使用已知值列表遍历数据框并从每次迭代创建新的数据框?我一直在想类似的东西:
for i in countyList:
if covid['county'] == i:
...
但是给出了一个模棱两可的值错误。我不确定确切需要定义什么。
解决方法
解决方案迭代county
列的唯一列表:
for name in covid.county.unique()
covid.loc[covid.county == name,:].to_csv(name+'.csv')
对于name
所命名的每个县:
- 我们正在从数据帧
covid
中选择行,其中county
等于name
- 然后将这样的选择保存到名为
name
+.csv
的CSV文件中。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。