如何解决根据Pandas Dataframe中的时间戳列过滤给定的列计数
- 我有一个如下所示的Pandas数据框
- 我想要我的输出或可视化图来说明:
- 在哪个小时内,有多少工作失败,完成(计数)
解决方法
首先通过boolean indexing
过滤仅填充Failed
的行,然后将crosstab
与DataFrame.plot.bar
结合使用:
df1 = df[df['Status'].eq('Failed')]
out = pd.crosstab(df1['Hour'],df1['Job'])
out.plot.bar()
,
import pandas as pd
df = pd.read_csv('./data.csv')
# status
status = set(df['Status'])
dfStatus = {s: df[df['Status'] == s] for s in status}
# hours
hours = set(df['Hour'])
dfStatusPerHour = {}
# calculate them explicitly
for s in status:
dfStatusPerHour[s] = {h: dfStatus[s][dfStatus[s]['Hour'] == h].shape[0] for h in hours}
# show results
for s in status:
print(f"{s} : {dfStatusPerHour[s]}")
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。