如何解决如何将float64值转换为等效的datetime格式?
如何将float64类型的值转换为datetime类型的值。
这是数据集中的前五个浮点值:
0 41245.0
1 41701.0
2 36361.0
3 36145.0
4 42226.0
Name: product_first_sold_date,dtype: float64
然后将浮点类型转换为日期时间类型值,我这样写:
from datetime import datetime
pd.to_datetime(y['product_first_sold_date'],format='%m%d%Y.0',errors='coerce')
但是作为输出,我得到了数据集中所有行的“ NaT”:
0 NaT
1 NaT
2 NaT
3 NaT
4 NaT
Name: product_first_sold_date,Length: 19273,dtype: datetime64[ns]
然后,这个:
print(pd.to_datetime(y.product_first_sold_date,infer_datetime_format = True))
但是它对数据集中的所有行显示相同的日期
0 1970-01-01 00:00:00.000041245
1 1970-01-01 00:00:00.000041701
2 1970-01-01 00:00:00.000036361
3 1970-01-01 00:00:00.000036145
4 1970-01-01 00:00:00.000042226
我真的不知道代码有什么问题吗?
我也尝试过这个:
pd.to_datetime(pd.Series(g.product_first_sold_date).astype(str),format='%d%m%Y.0')
并将其作为输出,我也更改了格式='%Y%m%d.0':
ValueError: time data '41245.0' does not match format '%d%m%Y.0' (match)
似乎没有任何效果,或者可能是我做错了什么,不知道如何解决。谢谢!
解决方法
我假设这些浮点值代表日期,因为Excel内部对其进行处理,即从1900-01-01开始的天数:
要将这种格式转换为Python / pandas日期时间,可以通过设置适当的来源和单位来实现:
df['product_first_sold_date'] = pd.to_datetime(df['product_first_sold_date'],origin='1899-12-30',unit='D')
...给出了所提供的示例
0 2012-12-02
1 2014-03-03
2 1999-07-20
3 1998-12-16
4 2015-08-10
Name: product_first_sold_date,dtype: datetime64[ns]
此处要注意的重点(请参阅@ chux-ReinstateMonica的评论)是1900-01-01是Excel中的第1天,而不是第0天(您必须作为来源提供)。零天是1899-12-30;如果您想知道为什么不是1899-12-31,那么解释很有趣,您可以找到更多的info here。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。