如何解决与之相似,但不同:将唯一值拆分为多个列的单独列
我的问题是我是否在R中有下一个数据帧。
a<-data.frame(col1=c("a","a","d","a"),col2=c("b","b","c","e","e"),col3=c("c",NA,NA),col4=c("d",col5=c("e",NA))
print(a)
col1| col2| col3| col4| col5|
a b c d e
a b d e NA
a c e NA NA
d e NA NA NA
a e NA NA NA
我需要这样的其他数据框:
b<-data.frame(col1=c("a","e"))
print(b)
col1| col2| col3| col4| col5|
a b c d e
a b NA d e
a NA c NA e
NA NA NA d e
a NA NA NA e
对不起,我没有概念来解释我的问题,因此我要问这个问题,但是我想我首先要:按列分隔与新列中其余组不同的行和第二个,以获取同一列中具有相同值的行。
我认为我的问题与此类似:Split unique values into separate columns for multiple columns
如果有人可以帮助我,我将非常感激。
解决方法
使用一些tidyverse库,您可以做
library(dplyr)
library(tidyr)
a %>%
mutate(id=row_number()) %>%
pivot_longer(-id) %>%
filter(!is.na(value)) %>%
pivot_wider(id_cols=id,names_from="value",values_from="value") %>%
select(-id)
我们使用数据透视功能来重塑和转换数据。窍门仅仅是添加id
列,以使其更容易按行排列数据。返回
a b c d e
<chr> <chr> <chr> <chr> <chr>
1 a b c d e
2 a b NA d e
3 a NA c NA e
4 NA NA NA d e
5 a NA NA NA e
,
另一个基本R选项:
AdditionalColumns
,
我们可以在base R
t(apply(a,1,function(x) {
v1 <- character(length(x))
v1[match(x,letters,nomatch = 0)] <- x
v1}))
# [,1] [,2] [,3] [,4] [,5]
#[1,] "a" "b" "c" "d" "e"
#[2,] "a" "b" "" "d" "e"
#[3,] "a" "" "c" "" "e"
#[4,] "" "" "" "d" "e"
#[5,] "a" "" "" "" "e"
或者另一个选择是
b <- a
m1 <- t(apply(a,function(x) {table(factor(x,levels = letters[1:5]))})) > 0
b[] <- colnames(m1)[col(m1)* NA^!m1]
b
# col1 col2 col3 col4 col5
#1 a b c d e
#2 a b <NA> d e
#3 a <NA> c <NA> e
#4 <NA> <NA> <NA> d e
#5 a <NA> <NA> <NA> e
或以上内容略有变化
t(apply(a,function(x) {
tbl1 <- table(factor(x,levels = letters[1:5]))
ifelse(tbl1 >0,names(tbl1),NA)}))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。