如何解决R:在data.frame中创建一个具有特定非连续条件的新列
想象一个人造数据帧
IDtest<-c(1,1,2,3,3)
Class<-c(1,4,5,4)
Day<-c(0,47,76,100,150,173,100)
Area<-c(0.45,0.85,1.50,1.53,1.98,5.2,0.36,0.58,1.2,1.36,2.26,3.59)
df<-data.frame(cbind(IDtest,Class,Day,Area))
df
IDtest Class Day Area
1 1 1 0 0.45
2 1 1 47 0.85
3 1 3 76 1.50
4 1 4 100 1.53
5 1 4 150 1.98
6 1 5 173 5.20
7 2 1 0 0.36
8 2 1 47 0.58
9 2 2 76 1.20
10 3 2 0 0.85
11 3 2 47 1.36
12 3 3 76 2.26
13 3 4 100 3.59
I'll like to do:
1) For IDtest 1 in Class 1: step1 = 47 - 0
2) For IDtest 1 in Class 3: step1 = 76 - 47
3) For IDtest 1 in Class 4: step1 = 150 - 76
4) For IDtest 1 in Class 4: step1 = 173 - 150
up to IDtest 3.
为此,请尝试:
df$step1 <- NA
for (i in 1:max(df$Class)){
if(i == 1){
df$step1[Class == i] <- max(df$Day[df$Class == i]) - 0 # quite silly
}else{
df$step1[Class == i] <- max(df$Day[df$Class == i]) - max(df$Day[df$Class == i - 1]) # "Last" as the "previous" Class,not inside the same Class
}}
如果我的Class变量是连续的OK,但是我的Class将值1更改为3。在这种情况下,我的代码为我提供-Inf值,因为必须使用最后一个Class值(1)而不是2 那不存在。
我想要的输出是:
new.df
IDtest Class Day Area step1
1 1 1 0 0.45 47
2 1 1 47 0.85 47
3 1 3 76 1.50 29
4 1 4 100 1.53 74
5 1 4 150 1.98 74
6 1 5 173 5.20 23
您在这里看到任何简单的修改吗?
解决方法
也许这应该可行
df %>% group_by(IDtest) %>% mutate(new = c(0,diff(Day)))
,
我不确定这是否是你所追求的
merge(df,within(
aggregate(Day ~ IDtest + Class,df,max),step1 <- ave(Day,IDtest,FUN = function(x) diff(c(0,x)))
),by = c("IDtest","Class"),all = TRUE
)
给出
IDtest Class Day.x Area Day.y step1
1 1 1 0 0.45 47 47
2 1 1 47 0.85 47 47
3 1 3 76 1.50 76 29
4 1 4 100 1.53 150 74
5 1 4 150 1.98 150 74
6 1 5 173 5.20 173 23
7 2 1 0 0.36 47 47
8 2 1 47 0.58 47 47
9 2 2 76 1.20 76 29
10 3 2 0 0.85 47 47
11 3 2 47 1.36 47 47
12 3 3 76 2.26 76 29
13 3 4 100 3.59 100 24
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。