如何解决对一个分类变量使用distinct,对其他分类列使用unique
我有一个数据集,其中每个患者id都有多个“ Specialty”变量和出院变量(两个值:住院和出院后)。我想针对每个专科计算不同的患者编号,而不考虑“唯一出院变量”。
PatientID Specialty admission_date Discharge
1 Geriatrics 2017-11-08 In_Hospital
1 Nephrology 2017-10-21 Post_discharge
1 Cancer 2017-10-21 Post_discharge
1 Geriatrics 2017-10-21 Post_discharge
我希望输出看起来像
Geriatrics 1
Nephrology 1
Cancer 1
并且要消除老年病学的最后一行,因为它是重复值并且属于较早的日期。
我已经尝试过了,但是在“住院”和“出院后”这两个组中都计入了老年病
Select DISTINCT [Speciality],[Thirty_day_Mortality_detail],count(Distinct[PatientID]) as number_of_patients_died
FROM #data
group by [Speciality],[Thirty_day_Mortality_detail]
ORDER BY [Speciality]
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。