使用两行变量名称重塑/熔化数据

如何解决使用两行变量名称重塑/熔化数据

我有一个大数据集需要重塑/融合。 我遇到的问题是第一行和第二行是变量名(即,第一行是一个人的 id,第二行列出了这个人的四个属性)。除此之外,第一列捕获收集值的日期。要查看我的数据集示例,请查看以下谷歌表 (https://docs.google.com/spreadsheets/d/19b_4hB6aM9JXReG67i9EF_sJVDHkNFHf4iShH8yrfOc/edit?usp=sharing) 中的 Sheet1。我想重塑我的数据,使其看起来像上面谷歌工作表中的 Sheet2。

有没有办法指定在我的melt 命令中有两个ID。第一个 id 是第一行(从第二列开始),第二个 id 是第一列(从第二行开始)。如果我可以为我正在尝试做的事情编写一个伪 R 脚本,我会写这样的东西。

melt(dt,id=c("Dates from A2:A6","Person from B1:I1")

谢谢!

解决方法

以下方法将完成您的工作,

library(tidyverse)
name <- readr::read_csv("csvs1.csv",col_names = F,n_max = 2)

name
# A tibble: 2 x 9
  X1    X2       X3       X4       X5       X6       X7       X8       X9      
  <chr> <chr>    <chr>    <chr>    <chr>    <chr>    <chr>    <chr>    <chr>   
1 NA    person_A person_A person_A person_A person_B person_B person_B person_B
2 Dates var1     var2     var3     var4     var1     var2     var3     var4    

nm <- paste(names[1,],names[2,sep = "-")
nm
[1] "NA-Dates"      "person_A-var1" "person_A-var2" "person_A-var3" "person_A-var4" "person_B-var1" "person_B-var2"
[8] "person_B-var3" "person_B-var4"

data <- readr::read_csv("csvs1.csv",skip = 2)

names(data) <- nm
data
# A tibble: 4 x 9
  `NA-Dates` `person_A-var1` `person_A-var2` `person_A-var3` `person_A-var4` `person_B-var1` `person_B-var2`
  <date>               <dbl>           <dbl>           <dbl>           <dbl>           <dbl>           <dbl>
1 2021-05-01            45.0            43.9            67.9            35.7            40.5            38.6
2 2021-05-02            50.4            52.6            67.9            41.9            41.7            43.9
3 2021-05-03            53.7            49.1            67.9            49.6            41.3            38.6
4 2021-05-04            53.7            52.6            73.2            45.7            29.8            33.3
# ... with 2 more variables: person_B-var3 <dbl>,person_B-var4 <dbl>

data %>% 
+   pivot_longer(!`NA-Dates`,names_to = c('person','.value'),names_sep = '-',names_prefix = 'person_')

# A tibble: 8 x 6
  `NA-Dates` person  var1  var2  var3  var4
  <date>     <chr>  <dbl> <dbl> <dbl> <dbl>
1 2021-05-01 A       45.0  43.9  67.9  35.7
2 2021-05-01 B       40.5  38.6  60.7  32.6
3 2021-05-02 A       50.4  52.6  67.9  41.9
4 2021-05-02 B       41.7  43.9  42.9  40.3
5 2021-05-03 A       53.7  49.1  67.9  49.6
6 2021-05-03 B       41.3  38.6  48.2  39.5
7 2021-05-04 A       53.7  52.6  73.2  45.7
8 2021-05-04 B       29.8  33.3  57.1  16.3
,

为了方便起见,这是使用 {name: 'Garfield Lucas,courthouse: 7463987}data.table 方法:

readr::type_convert

reprex package (v2.0.0) 于 2021 年 5 月 5 日创建

,

为了使用基础重塑,重要的是将级别组合在一个字符串中,用一个点将它们分开并重命名变量。

使用上面的 data.frame。

# Get variables names
varA <- as.character(df[1,])
varB <- names(df)
newNames <- paste(varA,varB,sep = '.')  # don't forget the point

# Drop first line,rename variables and pass rownames to a column
df <- df[-1,] 
names(df) <- newNames
df$dates <- row.names(df)    # added after last column

# reshape
lastVar <- ncol(df)-1        # because of rownames in last column
df <- reshape(df,varying = 1:lastVar,direction = 'long')

# and beautify
row.names(df) <- NULL
names(df)[names(df) == 'time'] <- 'person'
df <- df[,-ncol(df)]
df

>        dates   person    var1    var2    var3    var4
> 1 2021-05-01 person_A 45.0413 43.8596 67.8571 35.6589
> 2 2021-05-02 person_A 50.4132 52.6316 67.8571 41.8605
> 3 2021-05-03 person_A  53.719 49.1228 67.8571 49.6124
> 4 2021-05-04 person_A  53.719 52.6316 73.2143 45.7364
> 5 2021-05-01 person_B 40.4959 38.5965 60.7143 32.5581
> 6 2021-05-02 person_B 41.7355 43.8596 42.8571 40.3101
> 7 2021-05-03 person_B 41.3223 38.5965 48.2143 39.5349
> 8 2021-05-04 person_B 29.7521 33.3333 57.1429 16.2791

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


依赖报错 idea导入项目后依赖报错,解决方案:https://blog.csdn.net/weixin_42420249/article/details/81191861 依赖版本报错:更换其他版本 无法下载依赖可参考:https://blog.csdn.net/weixin_42628809/a
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下 2021-12-03 13:33:33.927 ERROR 7228 [ main] o.s.b.d.LoggingFailureAnalysisReporter : *************************** APPL
错误1:gradle项目控制台输出为乱码 # 解决方案:https://blog.csdn.net/weixin_43501566/article/details/112482302 # 在gradle-wrapper.properties 添加以下内容 org.gradle.jvmargs=-Df
错误还原:在查询的过程中,传入的workType为0时,该条件不起作用 &lt;select id=&quot;xxx&quot;&gt; SELECT di.id, di.name, di.work_type, di.updated... &lt;where&gt; &lt;if test=&qu
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct redisServer’没有名为‘server_cpulist’的成员 redisSetCpuAffinity(server.server_cpulist); ^ server.c: 在函数‘hasActiveC
解决方案1 1、改项目中.idea/workspace.xml配置文件,增加dynamic.classpath参数 2、搜索PropertiesComponent,添加如下 &lt;property name=&quot;dynamic.classpath&quot; value=&quot;tru
删除根组件app.vue中的默认代码后报错:Module Error (from ./node_modules/eslint-loader/index.js): 解决方案:关闭ESlint代码检测,在项目根目录创建vue.config.js,在文件中添加 module.exports = { lin
查看spark默认的python版本 [root@master day27]# pyspark /home/software/spark-2.3.4-bin-hadoop2.7/conf/spark-env.sh: line 2: /usr/local/hadoop/bin/hadoop: No s
使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams[&#39;font.sans-serif&#39;] = [&#39;SimHei&#39;] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -&gt; systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping(&quot;/hires&quot;) public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate&lt;String
使用vite构建项目报错 C:\Users\ychen\work&gt;npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-