如何解决从行时间序列中删除零值
我已经完成了这个脚本,但丢失了。我通过从 url 检索 Covid 数据来重做它,将一些列删除到仅显示的三列,重命名所述三列并使用melt(Date and Cases)。我一直在删除所有零(案例列)。
data = pd.read_csv('https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_US.csv')
df = pd.DataFrame(data)
df = df.drop(['UID','iso2','iso3','code3','FIPS','Lat','Long_','Combined_Key'],axis=1)
df.rename(columns={'Province_State':'State','Country_Region':'Country','Admin2':'City'},inplace=True)
df_melted = pd.melt(df,id_vars = ['City','State','Country'],value_vars=df.columns[3:],var_name='Date',value_name='Cases')
City State Country Date Cases
0 Autauga Alabama US 1/22/20 0
1 Baldwin Alabama US 1/22/20 0
2 Barbour Alabama US 1/22/20 0
3 Bibb Alabama US 1/22/20 0
4 Blount Alabama US 1/22/20 0
我之前删除零的代码是:
df = df.replace(0,np.nan).dropna(axis=0,how='any',subset=columns).fillna(0)
df = df[(df.T != 0).any()]
但我收到一条错误消息:
NameError: name 'columns' is not defined
我知道我之前在 df 设置的早期部分定义了列,但不记得它是什么以及它去了哪里。
任何帮助将不胜感激!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。