如何解决如何读取在其字段中包含逗号的csv文件?
我有一个关于电影的逗号分隔数据的csv文件。不幸的是,“电影名称”列中的某些条目包含逗号。因此,当我使用逗号作为分隔符读取R中的文件时,就会出现问题。但要提及的一件事是,电影名称列中的逗号始终以\开头。有没有办法使用这些反斜杠来防止read.csv函数使用电影名称中的这些逗号分隔?
解决方法
在csv文件中考虑以下数据
id,movie_name
1,a\,b\,c
2,ab\,bc\,cd
您可以通过以下方式执行此操作:将数据行作为字符串向量读取,将“ \”替换为其他内容,然后将其读取为csv
> read.csv(text=gsub("\\\\,","_",readLines("mycsv.csv")))
id movie_name
1 1 a_b_c
2 2 ab_bc_cd
,
您可以在read.csv中使用允许转义选项。假设电影列是带引号的字符串。 我已使用以下数据进行验证:
#Assumed csv file
Id,Movie_Name
1,"ab\,cd"
2,"abcd\,cd"
read.csv("<file path>",header = T,allowEscapes = T)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。