如何解决将列类型转换为数字时更改值
| 我有一个数据文件,格式从上面开始。 我将其加载到R中,并尝试使用dist列中的值绘制直方图,但出现错误“ x必须是数字”。因此,我尝试更改格式。> head(data)
V1 V2
1 type gene_dist
2 A 64667
3 A 76486
4 A 97416
5 A 30876
6 A 88018
> summary(data)
V1 V2
A : 67 100 : 1
B :122 100906 : 1
type: 1 102349 : 1
1033 : 1
10544 : 1
10745 : 1
(Other):184
我尝试使用sapply
设置列的格式,但值已更改:
> data[,2]<-sapply(data[,2],as.numeric)
> head(data)
V1 V2
1 type 190
2 A 146
3 A 166
4 A 189
summary(data)
V1 V2
A : 67 Min. : 1.00
B :122 1st Qu.: 48.25
type: 1 Median : 95.50
Mean : 95.50
3rd Qu.:142.75
Max. :190.00
有人知道为什么会这样吗?
解决方法
看来您的第二列是一个因素。您需要在
as.numeric
之前使用as.character
。这是因为因子在内部以整数形式存储在表格中,以提供因子级别标签。仅使用as.numeric
只会给出内部整数代码。由于这些函数是矢量化的,因此无需使用sapply
。
data[,2] <- as.numeric(as.character(data[,2]))
由于某些条目中包含一些非数字字符,因此该列可能是一个因素。任何此类条目都会在适当的警告下转换为NA
,但是您可能希望在原始数据中进行研究。
附带说明一下,变量名中的base9ѭ是一个不好的(尽管不是无效的)选择,因为存在相同名称的基函数。
, 当从read.csv中读取对象data
时,对于包含\'list \'值的矩阵,我遇到了相同的问题。 as.character()
在这里不起作用,as.numeric()
和data.matrix()
更改了矩阵中的值。相反,您需要使用以下内容:
matrix_numeric[1:m,1:n] <- as.numeric(as.matrix(data[1:m,1:n]))
首先转换为字符,然后转换为双精度字符。对于矩阵尺寸,数据[m,n]。 (您需要先创建对象matrix_numeric,然后再分配值...matrix_numeric <- matrix(0,m,n)
)
对于列表格式的向量vec1
,我使用以下方法:
out1 <- as.numeric(unlist(vec1));
, 读取文件时修复它可能比使用as.numeric()或as.character()更好。读取文件时,请确保
ѭ18is如果第一行是标题
NA
,而不是Na
或NaN
(ctrl + H,并在数据文件中替换为NA)
数字列中没有其他字符串
然后R将自动将它们视为数字。
, 我遇到了同样的问题,但是据我发现,根本原因是不同的,因此我将其作为回答,但不作评论。
df <- read.table(doc.csv,header = TRUE,sep = \",\",dec = \".\")
df$value
# Results in
[1] 2254 1873 2201 2147 2456 1785
# So..
as.numeric(df$value)
[1] 26 14 22 20 32 11
在我的情况下,原因是原始csv文档中的值存在空格。删除空格可解决此问题。
从dput(df)
\" 1178 \",\" 1222 \",\" 1223 \",\" 1314 \",\" 1462 \",
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。