将多个数据框的方式组合成一个数据框，同时显示每个数据框的名称

如何解决将多个数据框的方式组合成一个数据框，同时显示每个数据框的名称

请让我知道这个问题是否需要进一步/更好的解释

我对R很陌生，并且已经尝试这样做大约一个星期，所以也许有人可以提供帮助。

我有两个CSV文件（实际上更多，但为简单起见，我们使用两个）。在将它们作为数据框读取后，它们具有年份和销售列。然后，我将重命名销售列，以便以后知道哪个销售列属于哪个CSV文件。所以他们看起来像这样：

zz <- "Year  Sales_bmw
       2013   11
       2014   10
       2015   12
       2016   11"
df_bmw <- read.table(text = zz,header = TRUE)

zz <- " Year  Sales_ford
        2013   10
        2014   15
        2015   9
        2016   13"
df_ford <- read.table(text = zz,header = TRUE)

现在，我可以将它们连接在一起，这将为我提供一个包含“年”，“ Sales_bmw”和“ Sales_ford”列的数据框，并且我可以计算Sales_bmw和Sales_ford的均值。

可是我被困住了。

最后，我想要一个数据框，其中包含其他数据框的每个销售列的均值。因此它将有2个看起来像这样的条目（基本上是数据框中每个销售列的平均值和名称）：

我不知道如何从联接的数据帧（或者是宝马和福特数据帧本身）到达那里：

bmw_ford <- sales_bmw_df %>% inner_join (sales_ford_df)
head(bmw_ford)

##      Year  Sales_bmw Sales_ford
##    1 2013     11       10  
##    2 2014     10       15
##    3 2015     12       9
##    4 2016     11       13

我希望这是可以理解的：/感谢您的帮助。

解决方法

也许您可以尝试public void LogGameStats() { var data = new Dictionary<string,object>{ {"Number of Targets Collected",gameStats.targetCollectedCount},{"Number of Walls Hit",gameStats.wallHitCount},{"Number of Hazards Hit",gameStats.hazardHitCount},}; StartCoroutine(WriteDoc(GetDocumentReference(),data)); Debug.Log("I logged something"); } + stack

colMeans

给出

setNames(rev(stack(colMeans(df[-1]))),c("Name","Mean"))

数据

        Name  Mean
1  Sales_bmw 11.00
2 Sales_ford 11.75

一开始你做错了事。您不应该重命名Sales列，因为在两个数据框中它们是相同的是完美的。相反，添加另一列Brand来包含品牌名称并将它们组合在一起，然后使用summarise包中的dplyr函数：

library(dplyr)
df_bmw <- data.frame(Year = c(2013,2014,2015,2016),Sales = c(11,10,12,11))
df_ford <- data.frame(Year = c(2013,Sales = c(10,15,9,13))
df_bmw <- df_bmw %>%
  mutate(Brand = "Bmw")

df_ford <- df_ford %>%
  mutate(Brand = "Ford")

df <- bind_rows(df_bmw,df_ford)

df_smr <- df %>%
  group_by(Brand) %>%
  summarise(Mean = mean(Sales)) %>%
  ungroup()

更新：因为您已经更改了列名并连接了数据框架，所以另一种工作方式是：（但是我认为这不是一个好习惯）

library(dplyr)
df_bmw <- data.frame(Year = c(2013,Sales_bmw = c(11,Sales_ford = c(10,13))
df <- df_bmw %>% inner_join (df_ford,by = "Year") # shouldn't leave the 'by' parameter

df_smr <- df %>%
  summarise_all(mean) %>%
  select(-Year)

# transpose the data frame
rownames(df_smr) <- c("Mean")
df_smr <- as.data.frame(t(as.matrix(df_smr)))

这是tidyr和dplyr的解决方案：

library(dplyr)
library(tidyr)

#create data frames

zz <- "Year  Sales_bmw
       2013   11
       2014   10
       2015   12
       2016   11"
df_bmw <- read.table(text = zz,header = TRUE)

zz <- " Year  Sales_ford
        2013   10
        2014   15
        2015   9
        2016   13"
df_ford <- read.table(text = zz,header = TRUE)

df_bmw_ford_mean <- df_bmw %>% 
  #join the data frames
  inner_join(df_ford) %>% 
  #rename the columns
  rename("Bmw" = "Sales_bmw","Ford" = "Sales_ford") %>% 
  #pivot data from wide form to long form
  pivot_longer(cols = c("Bmw","Ford"),names_to = "Name") %>%
  #create group defined by variable in order to perform mean operation
  group_by(Name) %>%
  #create new data frame adding one column for the summary statistic specified,in this case the mean.
  summarise(Mean = mean(value))

#> # A tibble: 2 x 2
#>   Name   Mean
#>   <chr> <dbl>
#> 1 Bmw    11  
#> 2 Ford   11.8

^{由reprex package（v0.3.0）于2020-08-10创建}

将多个数据框的方式组合成一个数据框，同时显示每个数据框的名称

如何解决将多个数据框的方式组合成一个数据框，同时显示每个数据框的名称

解决方法

相关推荐