如何解决R创建具有指定开始日期的周数
这看起来应该很简单,但我找不到办法做到这一点。
我有一个从每年 8 月 1 日开始的销售周期,需要按周数汇总销售额。我需要创建一个“周数”字段,其中第 1 周从我指定的日期开始。到目前为止,我已经查看了 lubridate、baseR 和 strftime,但我找不到将“开始”日期从 01/01/YYYY 更改为其他日期的方法。
解决方案需要让我指定开始日期并将周数迭代为从开始日期起 7 天。实际开始日期并不总是发生在星期日或星期一。
EG 数据帧
eg_data <- data.frame(
cycle = c("cycle2019","cycle2019","cycle2018","cycle2017","cycle2016","cycle2016"),dates = as.POSIXct(c("2019-08-01","2019-08-10","2018-07-31","2018-08-16","2017-08-03","2017-08-14","2016-08-05","2016-08-29")),week_n = c("1","2","1","3","4"))
我希望结果看起来像上面那样 - 它会取每个周期的最小日期并将其用作起点,然后根据给定日期与周期开始日期的距离迭代周数。
解决方法
这几乎有效。 (进行日期算术为我们提供以秒为单位的持续时间:使用 lubridate
工具可能有更流畅的转换方式?)
secs_per_week <- 60*60*24*7
(eg_data
%>% group_by(cycle)
%>% mutate(nw=1+as.numeric(round((dates-min(dates))/secs_per_week)))
)
结果与 2017 年不匹配,因为第一次观察和第二次观察之间存在 11 天的差距......
cycle dates week_n nw
<chr> <dttm> <chr> <dbl>
5 cycle2017 2017-08-03 00:00:00 1 1
6 cycle2017 2017-08-14 00:00:00 2 3
,
这与您的示例不太一样,但也许根据您的领域经验进行一些摆弄,您可以对其进行调整:
library(lubridate)
eg_data %>%
mutate(aug1 = ymd_h(paste(str_sub(cycle,start = -4),"080100")),week_n2 = ceiling((dates - aug1)/ddays(7)))
编辑:如果您有每个周期开始的特定已知日期,将这些日期加入您的计算数据可能会有所帮助:
library(lubridate)
cycle_starts <- data.frame(
cycle = c("cycle2019","cycle2018","cycle2017","cycle2016"),start_date = ymd_h(c(2019080100,2018072500,2017080500,2016071300))
)
eg_data %>%
left_join(cycle_starts) %>%
mutate(week_n2 = ceiling((dates - start_date)/ddays(7)))
#Joining,by = "cycle"
# cycle dates week_n start_date week_n2
#1 cycle2019 2019-08-01 1 2019-08-01 1
#2 cycle2019 2019-08-10 2 2019-08-01 2
#3 cycle2018 2018-07-31 1 2018-07-25 1
#4 cycle2018 2018-08-16 3 2018-07-25 4
#5 cycle2017 2017-08-03 1 2017-08-05 0
#6 cycle2017 2017-08-14 2 2017-08-05 2
#7 cycle2016 2016-08-05 1 2016-07-13 4
#8 cycle2016 2016-08-29 4 2016-07-13 7
,
如果有人有更好的答案请发帖,但这有效 -
以示例中的数据帧为例,eg_data -
eg_data %>%
group_by(cycle) %>%
mutate(
cycle_start = as.Date(min(dates)),days_diff = as.Date(dates) - cycle_start,week_n = days_diff / 7,week_n_whole = ceiling(days_diff / 7) ) -> eg_data_check
(我第一次回答自己的问题)
,library("lubridate")
eg_data %>%
as_tibble() %>%
group_by(cycle) %>%
mutate(new_week = week(dates)-31)
,
这是一个使用 lubridate
library(lubridate)
eg_data %>%
group_by(cycle) %>%
mutate(new_week = floor(as.period(ymd(dates) - ymd(min(dates))) / weeks()) + 1)
# A tibble: 8 x 4
# Groups: cycle [4]
cycle dates week_n new_week
<chr> <dttm> <chr> <dbl>
1 cycle2019 2019-08-01 00:00:00 1 1
2 cycle2019 2019-08-10 00:00:00 2 2
3 cycle2018 2018-07-31 00:00:00 1 1
4 cycle2018 2018-08-16 00:00:00 3 3
5 cycle2017 2017-08-03 00:00:00 1 1
6 cycle2017 2017-08-14 00:00:00 2 2
7 cycle2016 2016-08-05 00:00:00 1 1
8 cycle2016 2016-08-29 00:00:00 4 4
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。