与此question类似,我在pandas DataFrame中有一个numpy.timedelta64列.根据上述问题的answer,有一个函数pandas.tslib.repr_timedelta64,可以很好地显示以天,小时:分:秒为单位的timedelta.我想只在几天和几小时内格式化它们.
所以我得到的是以下内容:
def silly_format(hours):
(days, hours) = divmod(hours, 24)
if days > 0 and hours > 0:
str_time = "{0:.0f} d, {1:.0f} h".format(days, hours)
elif days > 0:
str_time = "{0:.0f} d".format(days)
else:
str_time = "{0:.0f} h".format(hours)
return str_time
df["time"].astype("timedelta64[h]").map(silly_format)
得到了我想要的输出,但我想知道是否有类似于datetime.strftime的numpy或pandas中的函数可以根据提供的某些格式字符串格式化numpy.timedelta64?
我试图进一步调整@ Jeff的解决方案,但它比我的答案要慢.这里是:
days = time_delta.astype("timedelta64[D]").astype(int)
hours = time_delta.astype("timedelta64[h]").astype(int) % 24
result = days.astype(str)
mask = (days > 0) & (hours > 0)
result[mask] = days.astype(str) + ' d, ' + hours.astype(str) + ' h'
result[(hours > 0) & ~mask] = hours.astype(str) + ' h'
result[(days > 0) & ~mask] = days.astype(str) + ' d'
解决方法:
虽然@sebix和@Jeff提供的答案显示了将timedeltas转换为日期和小时的好方法,并且@ Jeff的解决方案特别保留了Series的索引,但是他们缺乏字符串最终格式的灵活性.我现在使用的解决方案是:
def delta_format(days, hours):
if days > 0 and hours > 0:
return "{0:.0f} d, {1:.0f} h".format(days, hours)
elif days > 0:
return "{0:.0f} d".format(days)
else:
return "{0:.0f} h".format(hours)
days = time_delta.astype("timedelta64[D]")
hours = time_delta.astype("timedelta64[h]") % 24
return [delta_format(d, h) for (d, h) in izip(days, hours)]
哪个适合我,我通过将该列表插入原始DataFrame来获取索引.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。