微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

减少具有多对多关系的两列ID

如何解决减少具有多对多关系的两列ID

我有一个包含两列非唯一ID(分别为ID-A和ID-B)的数据集。

单个ID-A可以具有多个ID-B,反之亦然。我试图使用传递性(称为ID-C)生成第三个设置的标识符,该标识符对于具有ID-A或ID-B的所有记录都设置为相同的值。如果两个记录既没有ID-A也没有ID-B,则它们之间只有一条传递链,才能共享ID-C集标识符。

为直观起见,我有类似前两列的内容,并想生成第三列(ID-C)

ID-A  ID-B  ID-C
1     1     1
1     2     1
1     3     1
2     2     1
2     4     1
3     4     1
4     5     2
5     5     2
5     6     2
6     7     3

我在AWS Athena内使用Presto sql,所以我不能使用我知道的任何变量或循环。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。