如何解决加载管道分隔的CSV数据,其蜂巢中的一列中带有“双引号
我的数据如下:-
Rollno|Name|height|department
101|Aman|5"2|C.S.E
将所有列作为字符串。 当我在蜂巢中加载以上数据时,我在开始和结束时都得到了额外的报价,如下所示:- 罗尔诺:-“ 101 名称:-阿曼 高度:-5“ 2 部门:-C.S.E“ 谁能帮我解决这个问题。
解决方法
指定分隔符,例如:
val df = spark.read.option("header","true").option("inferSchema","true").option("sep","|").csv("test.csv")
df.show(false)
+------+----+------+----------+
|Rollno|Name|height|department|
+------+----+------+----------+
|101 |Aman|5"2 |C.S.E |
+------+----+------+----------+
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。