与之相似，但不同：将唯一值拆分为多个列的单独列

如何解决与之相似，但不同：将唯一值拆分为多个列的单独列

我的问题是我是否在R中有下一个数据帧。

a<-data.frame(col1=c("a","a","d","a"),col2=c("b","b","c","e","e"),col3=c("c",NA,NA),col4=c("d",col5=c("e",NA))

print(a)

col1| col2| col3| col4| col5|
 a     b     c     d     e
 a     b     d     e    NA
 a     c     e     NA   NA
 d     e     NA    NA   NA
 a     e     NA    NA   NA

我需要这样的其他数据框：

b<-data.frame(col1=c("a","e"))

print(b)

col1| col2| col3| col4| col5|
 a     b     c     d     e
 a     b     NA    d     e
 a     NA    c     NA    e
 NA    NA    NA    d     e
 a     NA    NA    NA    e

对不起，我没有概念来解释我的问题，因此我要问这个问题，但是我想我首先要：按列分隔与新列中其余组不同的行和第二个，以获取同一列中具有相同值的行。

我认为我的问题与此类似：Split unique values into separate columns for multiple columns

如果有人可以帮助我，我将非常感激。

解决方法

使用一些tidyverse库，您可以做

library(dplyr)
library(tidyr)
a %>% 
  mutate(id=row_number()) %>% 
  pivot_longer(-id) %>% 
  filter(!is.na(value)) %>% 
  pivot_wider(id_cols=id,names_from="value",values_from="value") %>%
  select(-id)

我们使用数据透视功能来重塑和转换数据。窍门仅仅是添加id列，以使其更容易按行排列数据。返回

  a     b     c     d     e    
  <chr> <chr> <chr> <chr> <chr>
1 a     b     c     d     e    
2 a     b     NA    d     e    
3 a     NA    c     NA    e    
4 NA    NA    NA    d     e    
5 a     NA    NA    NA    e

另一个基本R选项：

AdditionalColumns

我们可以在base R

中完成此操作

t(apply(a,1,function(x) {
    v1 <- character(length(x))
    v1[match(x,letters,nomatch = 0)] <- x
   v1}))
#   [,1] [,2] [,3] [,4] [,5]
#[1,] "a"  "b"  "c"  "d"  "e" 
#[2,] "a"  "b"  ""   "d"  "e" 
#[3,] "a"  ""   "c"  ""   "e" 
#[4,] ""   ""   ""   "d"  "e" 
#[5,] "a"  ""   ""   ""   "e"

或者另一个选择是

b <- a
m1 <- t(apply(a,function(x) {table(factor(x,levels = letters[1:5]))})) > 0
b[] <- colnames(m1)[col(m1)* NA^!m1]
b
#  col1 col2 col3 col4 col5
#1    a    b    c    d    e
#2    a    b <NA>    d    e
#3    a <NA>    c <NA>    e
#4 <NA> <NA> <NA>    d    e
#5    a <NA> <NA> <NA>    e

或以上内容略有变化

t(apply(a,function(x) {
  tbl1 <- table(factor(x,levels = letters[1:5]))
  ifelse(tbl1 >0,names(tbl1),NA)}))

与之相似，但不同：将唯一值拆分为多个列的单独列

如何解决与之相似，但不同：将唯一值拆分为多个列的单独列

解决方法

相关推荐