如何解决'DataFrame'对象没有属性'orderby'
我正在我的应用程序上使用azure databrick。 而且我使用ML进行插补。得到结果后,我想加入并合并以使其成为完整的数据集,以便可以将其写入blob存储。
df3 = spark.sql("""
select * from df1
FULL OUTER JOIN df2
on df1.columnindex == df2.columnindex
""")
完成连接后,我显示了结果,并发现'columnindex'中缺少很多索引,因此我执行orderBy
df3 = df3.orderBy('columnindex')
在我看来,索引没有丢失,但没有正确排序。 但是当我进行工会之后
df5 = spark.sql("""
select * from unmissing_data
union
select * from df4
""")
并执行orderBy
df5 = df5.orderBy('columnindex')
我收到以下错误:'DataFrame'对象没有属性'orderby'。有人知道为什么会这样吗,为什么我在“ columnindex”列中的初始索引没有像在原始数据集中那样正确排序?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。