如何解决在R中的同一文件中处理不同的数字格式
我正在使用依赖用户输入的文件。当然,此输入是不一致的,我不确定解决该问题的最佳方法是什么?我正在处理数字,我已经将其读为字符:
mydata$output1
[1] "PP150" NA "50,376.45\r\n" "40096.21" "43721.59" NA NA "27282272.16" NA
"50,376.45\r\n"
实际上在预览中显示为一个简单的数字,根据我有限的经验,我从未见过类似的东西。我该如何从中创建数字矢量?
我想得到:
[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
解决方法
您可以使用gsub
删除不需要的字符:
x <- c("PP150",NA,"50,376.45\r\n","40096.21","43721.59","27282272.16",NA)
gsub('[,\r\n]','',x)
#[1] "PP150" NA "50376.45" "40096.21" "43721.59" NA NA "27282272.16" NA
由于“ PP150”不是数字,因此最终输出仍将是字符串。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。