在分组数据上使用 slide_dbl() 滚​​动窗口 数据

如何解决在分组数据上使用 slide_dbl() 滚​​动窗口 数据

这是以下问题的扩展:Rolling window slider::slide() with grouped data

我想用 slide_dbl() 改变我分组的 tibble 列,即在所有组上应用 slide_dbl(),但只在它们内部,而不是跨它们。

运行链接问题的解决方案时,我收到以下错误消息:

Error: Problem with `mutate()` input `rollreg`.
x Inapplicable method for 'mutate_' applied to object of class "c('double','numeric')".

我的 tibble 具有以下结构:

tibble [450,343 x 3] (S3: grouped_df/tbl_df/tbl/data.frame)
 $ company: num [1:450343] 1 1 1 1 1 ...
 $ date: Date[1:450343],format: "2011-11-30" "2011-12-31" "2012-01-31" "2012-02-29" ...
 $ result: num [1:450343] NA NA NA 12.5981 -2.9023 ...
 - attr(*,"groups")= tibble [3,339 x 2] (S3: tbl_df/tbl/data.frame)
  ..$ company: num [1:3339] 1 2 3 4 5 ...
  ..$ .rows : list<int> [1:3339] 

为了完成,这是我根据链接的解决方案运行的代码:

testtest <- data %>%
  group_by(company) %>% nest() %>%
  mutate(rollreg = map(data,~ .x %>% mutate(result_2 = slide_dbl(.x = .$result,.f = ~prod(1+.)-1,.before = 11,.after = -1,complete=TRUE)))) %>%
  select(-data) %>% unnest(rollreg)

这里,出现上述错误信息。我想这是因为数据结构。然而,我想不出任何解决方案(也没有类似 group_map() 或 group_modify() 之类的函数)。任何人都可以帮忙吗?提前致谢!

解决方法

一个选项是分组列的group_split(在示例中,使用'case',使用list循环遍历数据集的map,在{{1}中创建新列} 通过应用 mutate

slide_dbl

-输出

library(dplyr)
library(tidyr)
library(purrr)
data %>% 
   group_split(case) %>%
   map_dfr(~ .x %>% 
      mutate(out = slide_dbl(r1,.f = ~ prod(1 + .x) - 1,.before = 5,.after = -1,complete = TRUE)))

或者如果我们需要使用# A tibble: 30 x 6 # t case r1 r2 r3 out # <int> <chr> <dbl> <dbl> <dbl> <dbl> # 1 1 a -0.294 -0.164 1.33 0 # 2 2 a 0.761 1.01 0.115 -0.294 # 3 3 a -0.781 -0.499 0.290 0.243 # 4 4 a -0.0732 -0.110 0.289 -0.728 # 5 5 a -0.528 0.707 0.181 -0.748 # 6 6 a -1.35 -0.411 -1.47 -0.881 # 7 7 a -0.397 -1.28 0.172 -1.06 # 8 8 a 1.68 0.956 -2.81 -1.02 # 9 9 a -0.0167 -0.0727 -1.08 -1.24 #10 10 a 1.25 -0.326 1.61 -1.26 ## … with 20 more rows ,它会创建一个属性nest_by,所以,最好在应用之前rowwise

ungroup

-输出

out1 <- data %>%
    select(-t) %>% 
    nest_by(case) %>%
    ungroup %>%
    mutate(data = map(data,~ .x %>% 
             mutate(out = slide_dbl(r1,complete = TRUE))))

现在,我们out1 # A tibble: 3 x 2 # case data # <chr> <list> #1 a <tibble [10 × 4]> #2 b <tibble [10 × 4]> #3 c <tibble [10 × 4]> 结构

unnest

数据

 out1 %>% 
    unnest(data)
# A tibble: 30 x 5
#   case       r1      r2     r3    out
#   <chr>   <dbl>   <dbl>  <dbl>  <dbl>
# 1 a     -0.294  -0.164   1.33   0    
# 2 a      0.761   1.01    0.115 -0.294
# 3 a     -0.781  -0.499   0.290  0.243
# 4 a     -0.0732 -0.110   0.289 -0.728
# 5 a     -0.528   0.707   0.181 -0.748
# 6 a     -1.35   -0.411  -1.47  -0.881
# 7 a     -0.397  -1.28    0.172 -1.06 
# 8 a      1.68    0.956  -2.81  -1.02 
# 9 a     -0.0167 -0.0727 -1.08  -1.24 
#10 a      1.25   -0.326   1.61  -1.26 
# … with 20 more rows
,

我也有一个关于 slide_Dbl 函数的问题。我想查看其他滚动回归。我的数据已经修复了 8 个弱周,但是如果我想查看例如 16 周或 24 周,我应该将 (before= ) 从 8 更改为 16 吗?我问的原因是我没有原始数据集,但它已经修复了 8 周,所以如果我添加 (before= ) 和额外的 8 会是 16 吗?

new8 <- new%>%mutate( across(
where(is.double),function(x) slide_dbl(x,mean,na.rm = TRUE,.before = 8L) %>% lag()))

或者我应该放

new16 <- new%>%mutate(across(
where(is.double),.before = 16L) %>% lag()))
    

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-