如何解决我需要从数据框列表中按名称提取Excel工作表,其中每一行都是工作表的名称
因此,我在xlsx中有很多文件,每个文件都需要几张纸。结构是这样的:
3张最终成绩纸,如成绩单。第一个是整体得分,第二个是我们评估的第一件事,称为“ a”;第三个是“ b”分数。全局分数是介于“ a”和“ b”之间的索引。
文件没有相同的行数。例如,我们评估“ 1”,“ 2”,“ 3”,“ 4”,“ 5”和“ 6”。但是,许多文件没有“ 2”和“ 5”。其他人没有“ 5”,只有极少数人拥有我们评估的所有事物。在“ 1”表中,有人用多个条件的评估值填充单元格:“它显示所有信息?” “信息是一个csv文件?”并得分。
在每个文件中,每个数字都有一个隐藏的表,其演算数为“ a”,而每个数字都有一个隐式工作表,其演算数为“ b”:即a1,b1,a2,b2,a3,b3等。我知道,听起来很乱。
除此之外,我们还有另外两个隐藏表,其摘要版本为a1,b1等。
我需要摘要版本。
因此,我提取了我们评估的行的名称(即1、2、4、6)和R Studio中工作表的名称(全局索引,索引,b索引,a1,b1,摘要a1,摘要a2等),并使用map为每件事物创建一个列表。
所以...
我有一个dir_ls(folder)
,其中包含所有xlsx文件
我用purrr::map()
创建的数据帧列表,以及每个xlsx文件所需的工作表名称。这里是一个列表,列表的每个元素是一个数据框,在每个数据框中的每一行都是我需要提取的工作表的名称。
我尝试了这个,其中da是带有工作表名称的数据帧列表:
read_excel(dir_ls(inp)[1],sheet = map(da,~ as.character(.x)))
map(dir_ls(inp),~
read_excel(.x,~
as.character(.y))))
此文件适用于具有1个工作表名称的1个文件:
try <- da[["2_Eva_23_AGATAN.xlsx"]]
read_excel(paste(inp,list.files(inp),sep = "/")[1],sheet = as.character(try[1,1]))
但是,我需要146个文件和1348个工作表名称。
编辑: 我尝试这个:
read_excel(dir_ls(inp)[[1]],sheet = map_chr(try,~ .))
并获得以下消息
Error: Result 1 must be a single string,not a character vector of length 10
希望可以提供帮助。
我一直在想这是purrr具有不同向量长度的问题。
编辑2:
我知道了!
因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。
使用唯一的数据框,我使用map2。
map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))
现在,我必须过滤和清理数据帧(超过1000个)。
写这篇文章对我有很大帮助。
解决方法
我知道了!
因此,我一直在考虑两个不同长度的向量,因此决定制作一个包含Excel文件路径和工作表名称的数据框。
使用唯一的数据框,我使用map2。
map2(df$path,df$sheet,~ read_excel(path = .x,sheet = .y))
现在,我必须过滤和清理数据帧(超过1000个)。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。