如何解决将多个数据框的方式组合成一个数据框,同时显示每个数据框的名称
请让我知道这个问题是否需要进一步/更好的解释
我对R很陌生,并且已经尝试这样做大约一个星期,所以也许有人可以提供帮助。
我有两个CSV文件(实际上更多,但为简单起见,我们使用两个)。在将它们作为数据框读取后,它们具有年份和销售列。然后,我将重命名销售列,以便以后知道哪个销售列属于哪个CSV文件。所以他们看起来像这样:
zz <- "Year Sales_bmw
2013 11
2014 10
2015 12
2016 11"
df_bmw <- read.table(text = zz,header = TRUE)
zz <- " Year Sales_ford
2013 10
2014 15
2015 9
2016 13"
df_ford <- read.table(text = zz,header = TRUE)
现在,我可以将它们连接在一起,这将为我提供一个包含“年”,“ Sales_bmw”和“ Sales_ford”列的数据框,并且我可以计算Sales_bmw和Sales_ford的均值。
可是我被困住了。
最后,我想要一个数据框,其中包含其他数据框的每个销售列的均值。因此它将有2个看起来像这样的条目(基本上是数据框中每个销售列的平均值和名称):
我不知道如何从联接的数据帧(或者是宝马和福特数据帧本身)到达那里:
bmw_ford <- sales_bmw_df %>% inner_join (sales_ford_df)
head(bmw_ford)
## Year Sales_bmw Sales_ford
## 1 2013 11 10
## 2 2014 10 15
## 3 2015 12 9
## 4 2016 11 13
我希望这是可以理解的:/感谢您的帮助。
解决方法
也许您可以尝试public void LogGameStats()
{
var data = new Dictionary<string,object>{
{"Number of Targets Collected",gameStats.targetCollectedCount},{"Number of Walls Hit",gameStats.wallHitCount},{"Number of Hazards Hit",gameStats.hazardHitCount},};
StartCoroutine(WriteDoc(GetDocumentReference(),data));
Debug.Log("I logged something");
}
+ stack
colMeans
给出
setNames(rev(stack(colMeans(df[-1]))),c("Name","Mean"))
数据
Name Mean
1 Sales_bmw 11.00
2 Sales_ford 11.75
,
一开始你做错了事。您不应该重命名Sales
列,因为在两个数据框中它们是相同的是完美的。相反,添加另一列Brand
来包含品牌名称并将它们组合在一起,然后使用summarise
包中的dplyr
函数:
library(dplyr)
df_bmw <- data.frame(Year = c(2013,2014,2015,2016),Sales = c(11,10,12,11))
df_ford <- data.frame(Year = c(2013,Sales = c(10,15,9,13))
df_bmw <- df_bmw %>%
mutate(Brand = "Bmw")
df_ford <- df_ford %>%
mutate(Brand = "Ford")
df <- bind_rows(df_bmw,df_ford)
df_smr <- df %>%
group_by(Brand) %>%
summarise(Mean = mean(Sales)) %>%
ungroup()
更新: 因为您已经更改了列名并连接了数据框架,所以另一种工作方式是:(但是我认为这不是一个好习惯)
library(dplyr)
df_bmw <- data.frame(Year = c(2013,Sales_bmw = c(11,Sales_ford = c(10,13))
df <- df_bmw %>% inner_join (df_ford,by = "Year") # shouldn't leave the 'by' parameter
df_smr <- df %>%
summarise_all(mean) %>%
select(-Year)
# transpose the data frame
rownames(df_smr) <- c("Mean")
df_smr <- as.data.frame(t(as.matrix(df_smr)))
,
这是tidyr
和dplyr
的解决方案:
library(dplyr)
library(tidyr)
#create data frames
zz <- "Year Sales_bmw
2013 11
2014 10
2015 12
2016 11"
df_bmw <- read.table(text = zz,header = TRUE)
zz <- " Year Sales_ford
2013 10
2014 15
2015 9
2016 13"
df_ford <- read.table(text = zz,header = TRUE)
df_bmw_ford_mean <- df_bmw %>%
#join the data frames
inner_join(df_ford) %>%
#rename the columns
rename("Bmw" = "Sales_bmw","Ford" = "Sales_ford") %>%
#pivot data from wide form to long form
pivot_longer(cols = c("Bmw","Ford"),names_to = "Name") %>%
#create group defined by variable in order to perform mean operation
group_by(Name) %>%
#create new data frame adding one column for the summary statistic specified,in this case the mean.
summarise(Mean = mean(value))
#> # A tibble: 2 x 2
#> Name Mean
#> <chr> <dbl>
#> 1 Bmw 11
#> 2 Ford 11.8
由reprex package(v0.3.0)于2020-08-10创建
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。