如何解决Groupby日期时间格式和总和与其他列熊猫中的值
我一直在想如何将时间格式列分组并与另一列的值求和。
每隔4小时,我们就会获取信息(进入和退出),并希望进行分组,因此我们必须将所有条目加起来,然后每4小时退出一次。
问题是,如果我在下面应用代码,则会得到一个奇怪的结果。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?
test = temp.groupby(['DATETIME'])['Entries_count'].sum().reset_index(name='Entries_count')
当我检查结果时。时间不再是每4小时一次,总和是完全错误的。有人知道问题出在哪里吗?
ps:时间格式=“%m /%d /%Y%H:%M:%S”
解决方法
因此,在我的情况下,groupby函数在时间序列上不能很好地工作。 我没有使用groupby而是改用了重塑功能,在这种情况下更合适。 有关条目数不太可能发生的第二个问题是由于数据集中存在异常,在清理后可以提供更好的结果。
Distri = temp2.resample('4h').sum()
这解决了问题:)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。