如何解决将颜色分配给data.frame R中的特定值-发现错误
我有一个名为color
的带有示例名称的data.frame。我想根据结尾.U1
或.U2
为其分配颜色。
color
samples
1 30HB.U2
2 41ML.U2
3 22WS.U1
4 29MK.U1
5 29MK.U2
6 40WA.U1
7 30HB.U1
8 13BS.U1
9 50DM.U1
10 53BD.U1
11 36ER.U1
12 05AP.U1
13 06WT.U1
14 07RW.U1
15 07RW.U2
16 17SK.U1
17 26FB.U1
18 28HM.U1
19 31KE.U1
20 32FG.U1
21 34WF.U1
22 37SD.U1
23 41ML.U1
24 45GL.U2
25 47OT.U1
26 49RJ.U1
27 54SL.U1
28 54SL.U2
29 69HL.U1
30 69HL.U2
[...]
color <- color %>%
mutate(col = case_when(
samples == color$samples[grepl(color$samples,pattern = '.U1') == TRUE] ~ 'red',samples == color$samples[grepl(color$samples,pattern = '.U2') == TRUE] ~ 'blue'))
并非所有的颜色分配都有效。
color
samples col
1 30HB.U2 blue
2 41ML.U2 blue
3 22WS.U1 <NA>
4 29MK.U1 <NA>
14 07RW.U1 <NA>
15 07RW.U2 <NA>
16 17SK.U1 <NA>
24 45GL.U2 <NA>
25 47OT.U1 <NA>
26 49RJ.U1 <NA>
27 54SL.U1 <NA>
28 54SL.U2 <NA>
29 69HL.U1 <NA>
30 69HL.U2 <NA>
31 74SA.U1 <NA>
[...]
50 05AP.U2 <NA>
51 36ER.U2 <NA>
52 40WA.U2 <NA>
53 35AD.U2 <NA>
54 47OT.U2 <NA>
55 28HM.U2 <NA>
56 38AR.U2 <NA>
57 66DG.U2 <NA>
58 35AD.U1 <NA>
59 57MT.U2 blue
60 39DA.U2 blue
61 37SD.U2 blue
62 49RJ.U2 blue
为什么不起作用?我认为第一个任务和后面的任务都工作很奇怪... 谢谢您的任何建议
解决方法
您可以简单地使用substring
和factor
标签。
color <- transform(color,col=factor(substring(db$samples,6),labels=c("red","blue")))
color
# samples col
# 1 30HB.U2 blue
# 2 41ML.U2 blue
# 3 22WS.U1 red
# 4 29MK.U1 red
# 5 29MK.U2 blue
# 6 40WA.U1 red
# 7 30HB.U1 red
# 8 13BS.U1 red
# 9 50DM.U1 red
# 10 53BD.U1 red
# 11 36ER.U1 red
# 12 05AP.U1 red
# 13 06WT.U1 red
# 14 07RW.U1 red
# 15 07RW.U2 blue
# 16 17SK.U1 red
# 17 26FB.U1 red
# 18 28HM.U1 red
# 19 31KE.U1 red
# 20 32FG.U1 red
# 21 34WF.U1 red
# 22 37SD.U1 red
# 23 41ML.U1 red
# 24 45GL.U2 blue
# 25 47OT.U1 red
# 26 49RJ.U1 red
# 27 54SL.U1 red
# 28 54SL.U2 blue
# 29 69HL.U1 red
# 30 69HL.U2 blue
数据:
color <- structure(list(samples = c("30HB.U2","41ML.U2","22WS.U1","29MK.U1","29MK.U2","40WA.U1","30HB.U1","13BS.U1","50DM.U1","53BD.U1","36ER.U1","05AP.U1","06WT.U1","07RW.U1","07RW.U2","17SK.U1","26FB.U1","28HM.U1","31KE.U1","32FG.U1","34WF.U1","37SD.U1","41ML.U1","45GL.U2","47OT.U1","49RJ.U1","54SL.U1","54SL.U2","69HL.U1","69HL.U2")),class = "data.frame",row.names = c("1","2","3","4","5","6","7","8","9","10","11","12","13","14","15","16","17","18","19","20","21","22","23","24","25","26","27","28","29","30"))
,
mutate(col = case_when(samples == ...))
结构旨在比较样本的各个值。因此,随着该mutate操作的进行,它会将samples
中的每个值与grepl
在整个samples
变量上生成的逻辑矢量进行比较。发生了意外的结果。
这里是使用grepl
表达式执行此操作的一种方法。将==
替换为%in%,因为您要检查样本的每个值是否为所比较的样本之一。
color <- color %>%
mutate(col = case_when(
samples %in% color$samples[grepl(color$samples,pattern = '.U1') == TRUE] ~ 'red',samples %in% color$samples[grepl(color$samples,pattern = '.U2') == TRUE] ~ 'blue'))
这是使用grepl
的更简单方法。
color <- color %>%
mutate(col = case_when(
grepl(".U1",samples) ~ 'red',grepl(".U2",samples) ~ 'blue'))
您还可以使用str_detect
中的stringr
。
library(stringr)
color <- color %>%
mutate(col = case_when(str_detect(samples,".U1") ~ 'red',str_detect(samples,".U1") ~ 'blue'))
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。