如何解决在混合数据帧字符,向量,整数中将小写转换为大写,同时将数据类型保留在R中?
我有一个字符,整数和因子的混合数据框,我想将其转换为大写。这是一个常见的问题(例如here),但是我无法在不将数据类型之间转换的情况下将字符和因子更改为大写的答案。下面的工作示例:
# create a three column dataframe with characters,integers and factors:
df <- data.frame(v1=letters[1:5],v2=1:5,v3=as.factor(letters[10:14]),stringsAsFactors=FALSE)
v1 v2 v3
1 a 1 j
2 b 2 k
3 c 3 l
4 d 4 m
5 e 5 n
glimpse(df)
# v1 <chr> "a","b","c","d","e"
# v2 <int> 1,2,3,4,5
# v3 <fct> j,k,l,m,n
mutate_all和toupper变为大写,但将因子转换为字符:
df <- mutate_all(df,funs(toupper))
glimpse(df)
# v1 <chr> "A","B","C","D","E"
# v2 <chr> "1","2","3","4","5"
# v3 <chr> "J","K","L","M","N"
mutate_if和str_to_upper适用于is.character,但不适用于以下因素:
df <- df %>% mutate_if(is.character,str_to_upper)
glimpse(df)
# v1 <chr> "A","E"
# v2 <int> 1,n
mutate_if和str_to_upper适用于is.factor BUT将因子转换为字符:
df <- df %>% mutate_if(is.character,str_to_upper)
df <- df %>% mutate_if(is.factor,5
# v3 <chr> "J","N"
理想情况下,我想找到一个保护性的解决方案,该解决方案可以保留数据类型并可以应用于任何数据框。
解决方法
df %>%
mutate(across(where(is.character),str_to_upper),across(where(is.factor),~ factor(str_to_upper(.x))))
,
toupper
或str_to_upper
将类更改为字符。您有两种选择:
- 转换回
factor
:
df <- df %>% mutate_if(is.character,str_to_upper)
df <- df %>% mutate_if(is.factor,~factor(str_to_upper(.)))
str(df)
#'data.frame': 5 obs. of 3 variables:
# $ v1: chr "a" "b" "c" "d" ...
# $ v2: int 1 2 3 4 5
# $ v3: Factor w/ 5 levels "J","K","L","M",..: 1 2 3 4 5
- 更改因子变量的
levels
。将上面的步骤1和2合并为1。
df <- df %>% mutate_if(~is.character(.) || is.factor(.),~if(is.factor(.)) {levels(.) <- toupper(levels(.));.} else toupper(.))
请注意,_if
,_at
,_all
动词已在dplyr
1.0.0中弃用,以across
代替。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。