如何解决在开始和结束日期重叠的情况下获取持续时间
我的任务是找到给定一系列参与者标识符,程序名称,程序开始日期和程序结束日期的每个程序参与者的计划注册总天数。 最困难的假设是,参与者可能一次注册一个以上的程序,但我们不应重复计算任何重叠。 例如,(一位我粘贴下表的一部分,希望它能起作用...)按开始日期排序的一位参与者:
ID Prog.Name Start.date End.date
4160 Program1 1/17/2016 1/22/2016
4160 Program 2 1/27/2016 1/28/2016
4160 Program 3 2/4/2016 6/11/2016
4160 Program 1 3/12/2016 3/19/2016
4160 Program 3 12/11/2016 2/1/2017
4160 Program 1 2/13/2017 4/30/2017
4160 Program 3 5/16/2017 5/17/2017
4160 Program 1 10/9/2017 10/13/2017
4160 Program 3 10/19/2017 10/20/2017
4160 Program 1 10/27/2018 11/4/2018
4160 Program 3 2/28/2019 3/3/2019
第四行(程序1)完全在第3行(程序3)的间隔之内,因此不应计算在内。
我发现的最好的理论方法是生成我们要计算的所有天数的列表,然后找到distinct()
天。为此,我尝试将seq()
函数与程序的开始和结束日期一起使用。我已经通过一次输入一个开始和结束日期来完成这项工作,但没有提供参与者,程序和开始/结束日期的完整数据框。
我还考虑过使用lubridate::interval()
来获取间隔,但是当使用group_by(Participant.Site.Identifer)
来获取唯一的,不重叠的间隔时,我不知道如何将它们相加。
关于如何解决这个问题的任何想法?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。