如何解决如何计算pyspark中的重叠日期
我拥有与多家公司合作的用户的数据。一些用户同时在多个公司工作。如何在不考虑重叠经验的情况下汇总整体经验。 我已经通过一些链接获得了正确的解决方案。任何帮助将不胜感激。
EMP CSV数据
fullName,Experience_datesEmployeed,Experience_expcompany,Experience_expduraation,Experience_position
David,Feb 1999 - Sep 2001,Foothill,2 yrs 8 mos,Marketing Assoicate
David,1994 - 1997,abc,3 yrs,Senior Auditor
David,Jun 2020 - Present,Fellows INC,3 mos,Director Board
David,2017 - Jun 2019,2 yrs,Fellow - Class 22
David,Sep 2001 - Present,The John D.,19 yrs,Manager
预期输出:
FullName,Total_Experience
David,24.8 yrs
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。