如何解决减少具有多对多关系的两列ID
我有一个包含两列非唯一ID(分别为ID-A和ID-B)的数据集。
单个ID-A可以具有多个ID-B,反之亦然。我试图使用传递性(称为ID-C)生成第三个设置的标识符,该标识符对于具有ID-A或ID-B的所有记录都设置为相同的值。如果两个记录既没有ID-A也没有ID-B,则它们之间只有一条传递链,才能共享ID-C集标识符。
为直观起见,我有类似前两列的内容,并想生成第三列(ID-C)
ID-A ID-B ID-C
1 1 1
1 2 1
1 3 1
2 2 1
2 4 1
3 4 1
4 5 2
5 5 2
5 6 2
6 7 3
我在AWS Athena内使用Presto sql,所以我不能使用我知道的任何变量或循环。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。