如何解决R中的简单T转换出错
大家!我不是R方面的专家,但是我有一些经验。但是,现在我不知道该怎么办。
我有一个数据框,其中某些列应转换为T尺度(均值= 50和sd = 10的T分数)。公式为50 + 10 *(x-M)/ SD。其中m是原始列的平均值,SD是原始列的标准偏差。
我有一个包含必要列名称的向量。我写了周期来转换我的数据。但是出了点问题,转换之后,我的数据看起来像是逐渐减小的值的列。请帮忙!
我的代码:
mmpi <- c("L_SMOL","F_SMOL","K_SMOL","Hs1SMOL","D2SMOL","Hy3SMOL","Pd4SMOL","Pa6SMOL","Pt7SMOL","Se8SMOL","Ma9SMOL")
for (i in 1:11){
data.main[j,mmpi[i]] <- 50+10*((data.main[j,mmpi[i]]-mean(data.main[,mmpi[i]]))/sd(data.main[,mmpi[i]]))
}
}
解决方法
这很容易在tidyverse
中完成,我们可以在across
中指定感兴趣的列,循环遍历并执行scale/standardization
library(dplyr)
data.transformed <- data.main %>%
mutate(across(mmpi,~ 50 + 10 * ((. - mean(.))/sd(.))))
例如
head(mtcars) %>%
mutate(across(names(.)[1:3],~ 50 + 10 * ((. - mean(.))/sd(.))))
# mpg cyl disp hp drat wt qsec vs am gear carb
#1 52.83069 50.00000 44.23453 110 3.90 2.620 16.46 0 1 4 4
#2 52.83069 50.00000 44.23453 110 3.90 2.875 17.02 0 1 4 4
#3 63.02119 34.18861 38.45053 93 3.85 2.320 18.61 1 1 4 1
#4 55.09525 50.00000 55.13516 110 3.08 3.215 19.44 1 0 3 1
#5 39.80951 65.81139 66.48071 175 3.15 3.440 17.02 0 0 3 2
#6 36.41268 50.00000 51.46454 105 2.76 3.460 20.22 1 0 3 1
OP的代码为行索引显示j
,为列索引显示i
,而for
循环仅遍历列
在base R中,您可以这样做:
data.main[,mmpi] = 50 + 10 * scale(data.main[,mmpi])
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。