如何解决在R中将SQL求和和计算转换为dplyr
作为SQL查询的一部分,以下是要转换为dplyr语法的聚合的一部分:
case when sum(amy_jan) != 0 then sum(cost_jan)/sum(amy_jan) else 0 end as ratio_jan
-- ...
case when sum(amy_dec) != 0 then sum(cost_dec)/sum(amy_dec) else 0 end as ratio_dec
dplyr语法看起来像什么?
解决方法
如果您要查找的是与SQL-dplyr
语句等效的case ... when ...
,则为dplyr::case_when()
。
更具体地说,在一个您似乎要描述的用例(giving a reproducible example of any kind and your expected output would've been helpful here!)上,类似这样的例子将展示此功能:
library(dplyr)
library(purrr)
months <- tolower(month.abb)
# here I'm dummying some data,like what you're describing
df <- months %>%
map_dfc(
~ tibble(
!!paste0("cost_",.x) := sample(0:10,100,replace = T),!!paste0("amy_",replace = T)
)
)
# summarise that dataframe,once for every month in our list
df_summary <- df %>%
summarise(
ratio_jan = case_when(
sum(amy_jan) > 0 ~ sum(cost_jan) / sum(amy_jan),T ~ 0
),# ratio_feb = case_when(...),# ... and so on,for every month
)
以上内容结合了case_when
,可以在dplyr
中复制您在SQL风格中共享的内容。
下面的代码是一个扩展,使用purrr::map_dfc
对缩写的月份进行迭代,并将计算出的“ ratio_xxx”值绑定在一起。这省去了必须对12个变量计算进行硬编码的麻烦...:)
df_summary2 <- months %>%
map_dfc(
~ df %>%
summarise(
!!paste0("ratio_",.x) := case_when(
sum(.data[[paste0("amy_",.x)]]) > 0 ~ sum(.data[[paste0("cost_",.x)]]) / sum(.data[[paste0("amy_",.x)]]),T ~ 0
)
)
)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。