如何解决R mergerbinds而不是合并
我在R中遇到merge()
的行为,我无法理解。似乎根据一列中是否包含一个或多个唯一值来合并或绑定数据帧。
a1 <- data.frame (A = c (1,1))
a2 <- data.frame (A = c (1,2))
# > merge (a1,a1)
# A
# 1 1
# 2 1
# 3 1
# 4 1
# > merge (a2,a2)
# A
# 1 1
# 2 2
在两种情况下,后者都是我期望和想要的结果。我还尝试过用多于一列的内容,以及用字符代替数字,结果是相同的:多个值导致合并,一个唯一值导致重新绑定。
解决方法
在第一种情况下,每行匹配两行,因此输出中有2x2 = 4行;在第二种情况下,每行匹配了一行,因此输出中有2行。
要匹配行号,请使用此:
merge(a1,a1,by = 0)
## Row.names A.x A.y
## 1 1 1 1
## 2 2 1 1
或匹配行号,仅返回左实例:
library(sqldf)
sqldf("select x.* from a1 x left join a1 y on x.rowid = y.rowid")
## A
## 1 1
## 2 1
或匹配行号并返回两个实例:
sqldf("select x.A A1,y.A A2 from a1 x left join a1 y on x.rowid = y.rowid")
## A1 A2
## 1 1 1
## 2 1 1
,
该行为在文档中进行了详细说明,但是基本上merge()
会默认为您提供一个data.frame
,其中的列均来自两个原始df。它将通过所有公共列的唯一值合并两个行。
df1 <- data.frame(a = 1:3,b = letters[1:3])
df2 <- data.frame(a = 1:5,c = LETTERS[1:5])
df1
a b
1 1 a
2 2 b
3 3 c
df2
a c
1 1 A
2 2 B
3 3 C
4 4 D
5 5 E
merge(df1,df2)
a b c
1 1 a A
2 2 b B
3 3 c C
第一个示例中发生的事情是merge()
希望通过A
列合并两个数据帧的行,但是由于两个df中的两行都相同,所以无法计算合并哪一行,以便创建所有可能的组合。
在第二个示例中,您没有这个问题,因此合并是明确的。 1
行和2
行将合并在一起。
当dfs中有多个列时,情况更加明显:
情况1:
> df1 <- data.frame(a = c(1,1),b = letters[1:2])
> df2 <- data.frame(a = c(1,c = LETTERS[1:2])
> df1
a b
1 1 a
2 1 b
> df2
a c
1 1 A
2 1 B
> merge(df1,df2)
a b c
1 1 a A
2 1 a B
3 1 b A
4 1 b B
情况2:
> df1 <- data.frame(a = c(1,2),c = LETTERS[1:2])
> df1
a b
1 1 a
2 2 b
> df2
a c
1 1 A
2 2 B
> merge(df1,df2)
a b c
1 1 a A
2 2 b B
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。