如何解决从hh:mm:ss和h:m更改为分钟数
我正在为ML模型建立健康数据库 我有一个带有异类数据(1600行)的对象类型列的DataFrame:
46 1:37
47 3:50
48 1:09
49 1:30
50 2:08
51 NaN
52 2:36
53 1:32
54 01:23:00
55 0:59
56 1:40
57 02:10:00
58 2:51
59 1:55
Name: delay,dtype: object
我相信格式是hh:mm:ss或h:m,但我很难将其转换为分钟数(同时保留缺失值)
如果我用
pd.to_timedelta(df[delay].astype(str),errors='coerce') / pd.Timedelta(1,'min')
我得到了hh:mm:ss行所需的值(分钟数),但是我得到了h:m值的NaN
谢谢!
解决方法
使用totalseconds函数并获取秒,然后将其除以60得到分钟:
pd.to_timedelta(df[delay].astype(str),errors='coerce').totalseconds()/60
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。