将目录中的文件放入数组变量

如何解决将目录中的文件放入数组变量

我正在编写bash代码，该代码将在运行该目录的位置搜索特定文件，并将其添加到数组变量中。我遇到的问题是格式化结果。我需要在当前目录中找到所有压缩文件，并按上次修改的顺序显示文件的名称和大小。我想获取该命令的结果并将其放入每个包含文件名称和相应大小的行元素的数组变量中，但是我不知道该怎么做。我不确定是否应该使用命令“ find”而不是“ ls”，但这是到目前为止的内容：

find_files="$(ls -1st --block-size=MB)"
arr=( ($find_files) )

解决方法

这两种解决方案均有效，并已通过本文中的复制粘贴进行了测试。

第一个相当慢。一个问题是循环内的外部程序调用-例如，对每个文件调用date。您可以通过在输出数组中不包括日期来加快速度（请参见下面的注释）。特别是对于方法2来说-不会导致while循环内没有 external 命令调用。但是方法1确实是个问题-慢几个数量级。

例如，有人可能知道如何将纪元日期转换为awk中的另一种格式，这可能会更快。也许您也可以在awk中进行排序。也许只保留纪元日期？

这些解决方案是bash / GNU笨重的，并且不能移植到其他环境（此处为字符串find -printf）。 OP被标记为linux和bash，因此可以假定使用GNU。

解决方案1-捕获任何压缩文件-使用file进行匹配（缓慢）

“压缩”的条件是file输出中包含单词compress
足够可靠，但是也许与其他文件类型描述存在冲突？
file -l | grep compress（文件5.38，Ubuntu 20.04，WSL）对我而言根本没有冲突（列出的所有文件均为压缩格式）
除此以外，我找不到分类任何压缩文件的方法
我在包含1664个文件的目录上运行了此文件-时间（实际）为 40秒

#!/bin/bash

# Capture all files,recursively,in $TARGET,that are
# compressed files. In an indexed array. Using file name
# extensions to match.

# Initialise variables,and check the target is valid
declare -g c= compressed_files= path= TARGET=$1
[[ -r "$TARGET" ]] || exit 1

# Make the array
# A here string (<<<) must be used,to keep array in the global environment
while IFS= read -r -d '' path; do
    [[ "$(file --brief "${path%% *}")" == *compress* ]] &&
    compressed_files[c++]="${path% *} $(date -d @${path##* })"
done < \
    <(
        find "$TARGET" -type f -printf '%p %s %T@\0' |
        awk '{$2 = ($2 / 1024); print}' |
        sort -n -k 3
    )

# Print results - to test
printf '%s\n' "${compressed_files[@]}"

解决方案2-使用文件扩展名-快几个数量级

如果您确切知道要查找的扩展名，则可以用find命令组成它们
这是更快的
在与上述相同的目录中，包含1664个文件-时间（实际）为200毫秒
此示例查找.gz，.zip和.7z（分别为gzip，zip和7zip）
我不确定-type f -and -regex '.*[.]$gz\|zip\|7z$ -and printf是否会再次更快，现在我想到了。我从问题开始，因为我认为那是更快的
这也可能允许将扩展列表存储在变量中。
此方法避免对目标中的每个文件进行file分析
这也使while循环更短-您只需要迭代 matches
请注意此处-printf的重复，这是由于逻辑查找用途：-printf是'True'。如果它本身包括在内，它将充当“匹配”并打印所有文件
它必须用作名称匹配为true的结果（使用-and）
也许有人的构图更好？

#!/bin/bash

# Capture all files,and check the target is valid
declare -g c= compressed_files= path= TARGET=$1
[[ -r "$TARGET" ]] || exit 1

while IFS= read -r -d '' path; do
    compressed_files[c++]="${path% *} $(date -d @${path##* })"
done < \
    <(
        find "$TARGET" \
            -type f -and -name '*.gz'  -and -printf '%p %s %T@\0' -or \
            -type f -and -name '*.zip' -and -printf '%p %s %T@\0' -or \
            -type f -and -name '*.7z'  -and -printf '%p %s %T@\0' |
        awk '{$2 = ($2 / 1024); print}' |
        sort -n -k 3
    )

# Print results - for testing
printf '%s\n' "${compressed_files[@]}"

（两种方法的样本输出）：

$ comp-find.bash /tmp
/tmp/comptest/websters_english_dictionary.tmp.tar.gz 265.148 Thu Sep 10 07:53:37 AEST 2020
/tmp/comptest/What_is_Systems_Architecture_PART_1.tar.gz 1357.06 Thu Sep 10 08:17:47 AEST 2020

注意：

您可以添加文字K来指示块大小/单位（千字节）
如果只想从该数组打印路径，则可以使用后缀删除：printf '%s\n' "${files[@]&& *}"
对于数组中没有日期（用于排序，但可以完成其工作），只需删除 $(date -d @${path##* })（包括空格）。
种类的切线，但是要使用不同的日期格式，请将$(date -d @${path##* })替换为： $(date -I -d @${path##* }) ISO格式-请注意简短选择样式：date -Id @[date]对我不起作用 $(date -d @${path##* } +%Y-%M-%d_%H-%m-%S)类似于ISO，但w /秒 $(date -d @${path##* } +%Y-%M-%d_%H-%m-%S)再次相同，但w / ns（find为ns）

很长的帖子，很抱歉，希望它能提供很多信息。

我不确定您希望数组使用哪种格式，但是下面的代码片段创建了一个关联数组，该数组以filename为键，大小为值：

$ ls -l test.{zip,bz2}
-rw-rw-r-- 1 user group 0 Sep 10 13:27 test.bz2
-rw-rw-r-- 1 user group 0 Sep 10 13:26 test.zip

$ declare -A sizes; while read SIZE FILENAME ; do sizes["$FILENAME"]="$SIZE"; done < <(find * -prune -name '*.zip' -o -name *.bz2  | xargs stat -c "%Y %s %N" | sort | cut -f 2,3 -d " ")

$ echo "${sizes[@]@A}"
declare -A sizes=(["'test.zip'"]="0" ["'test.bz2'"]="0" )

$

如果只需要一个按字面意义的“文件名大小”条目的数组，那就更容易了：

$ while read SIZE FILENAME ; do sizes+=("$FILENAME $SIZE"); done < <(find * -prune -name '*.zip' -o -name *.bz2  | xargs stat -c "%Y %s %N" | sort | cut -f 2,3 -d " ")

$ echo "${sizes[@]@A}"
declare -a sizes=([0]="'test.zip' 0" [1]="'test.bz2' 0")

$

将目录中的文件放入数组变量

如何解决将目录中的文件放入数组变量

解决方法

相关推荐