如何解决在scala中将列连接到df列
我有这样的df
col1 col2 col3
1 ab file1
1 ab file2
2 bd file3
2 bd file4
3 fe file2
现在我需要将col3与;连接起来。定界符。 输出shd就像
Col1 col2 col3
1 ab file1;file2
2 bd file3;file4
3 fe file2
我用过concat_ws(“;”,collect_set(col3))
但是有时在col3中,我得到的是file1,file2,有时是file2,file1。
如何获得所需的输出。
解决方法
df.sort(col2,col3).groupBy(col2).agg(concat_ws(";",collect_set(col3)))
您需要按照要求输出的顺序对数据框进行排序。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。