如何解决如何在流媒体中获得两个月份日期之间的差异?
事情就是这样,我正在构建一个流线型应用程序来获取同类群组数据。就像这里解释的那样:https://towardsdatascience.com/a-step-by-step-introduction-to-cohort-analysis-in-python-a2cbbd8460ea。所以,基本上我现在有一个数据框,其中包含群组日期(群组)、属于该群组并在该月购买的客户数量(n_customers)和付款月份(订单月份) )。现在,我必须得到一个关于周期数的列。我的意思是,我有这个:
cohort order_month n_customers
2009-12 2009-12 1045
2009-12 2010-01 392
2009-12 2010-02 358
.
.
.
我正在努力做到这一点:
cohort order_month n_customers period_number
2009-12 2009-12 1045 0
2009-12 2010-01 392 1
2009-12 2010-02 358 2
.
.
.
数据框的名称是 df_cohort。
因此,在 2009 年 12 月,12/2009 年队列中有 1045 名客户购买了商品。在 01/2010 月份,有来自 12/2009 队列的 392 位顾客购买了东西。等等。我需要创建列 period_number 以构建我的热图。
我试过运行这个:
df_cohort["period_number"] = (
df_cohort - df_cohort
).apply(attrgetter("n"))
但是我收到了这个错误:
AttributeError: 'Timedelta' object has no attribute 'n'
我需要构建与教程略有不同的数据框,这就是我遇到此错误的原因。从现在开始有什么办法可以解决这个问题吗?之前没有改变任何东西,但只是从这个开始。
关于每一列的数据类型,order_month 和 corhort 都是 datetime64[ns]。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。