如何解决如何确定文件是否被另一个文件使用/调用?
| 我目前正在大学二年级,因此我的编程技能和知识并不像我所希望的那样强大。暑假期间,我正在一家Web开发公司实习,我完全被分配给我的第一个任务踩了。这就是为什么我在这里寻求帮助。 在主文件夹中,有许多子文件夹,并且在每个子文件夹中,有许多.js .cs和.php文件-大约1000个文件。但是没有使用大约300个。我需要打开每个子文件夹,看看是否有任何其他文件使用/调用了这些文件中的任何一个。如果不是,则需要将未使用文件的位置存储在文本文件中。 我做了一些研究,发现命令grep -r filename *
可以做到这一点,但是在命令行上我无法弄清楚如何循环浏览文件夹并根据文件夹内的内容更改文件名。我拥有的工作站在Windows中安装了Cygwin。
解决方法
echo file,count >results.csv
for f in $(find . -name *.js -o -name *.cs -o -name *.php)
do
echo $f,$(grep -cr $(basename $f) *) >> results.csv
done
这将为您提供一个这样的csv文件,其中包含每个文件被引用的次数。
file,count
file1,3
file2,1
file3,0
编辑以删除grepping之前的文件路径
,这不需要双循环吗? (大氧气)。您必须在每个文件中搜索文件中的每个实例。
我会使用Perl而不是Awk或BASH(尽管可以在BASH中进行)。
#! /usr/bin/env perl
use warnings;
use strict;
use feature qw(say);
use File::Find; #Not crazy about File::Find,but it\'s a standard module
use File::Basename;
my %fileHash;
my @dirs = qw(foo bar barfu fufu barbar); #List of the directories you\'re searching
#Finds the name of all the files. Include ALL files and not just .php,etc.
find(\\&wanted,@dirs);
sub wanted {
next if (-d $File::Find::name); #Skip directories
$fileHash{$File::Find::name} = 0; #Number of times file is referenced
}
# Outer Loop: Foreach file you have to parse
foreach my $fileName (keys %fileHash) {
# We don\'t have to grep anything except those below.
(my $suffix = $fileName) =~ s/.*\\.//;
next unless ($suffix eq \".js\" or $suffix eq \".cs\" or $suffix eq \".php\");
#Slurp up file in an array. That way,we can use the grep command
open (FILE,$fileName) or die qq(Can\'t open \"$fileName\" for reading\\n);
my @lines = <FILE>;
close FILE;
# Now,look for each and every file you\'ve got in that directory tree
# in this particular file. This is an inner loop
foreach my $fileToFind (keys %fileHash) {
my $basename = basename($fileToFind);
# If any lines in the file contain the file name,increment the hash.
if (grep /$basename/,@lines) {
$fileHash{$fileToFind} += 1;
}
}
}
#Now just print out those files who never got incremented (i.e. never referenced)
foreach my $fileName (keys %FileHash) {
next if ($fileHash{$fileName} != 0);
say \"File: $fileHash{$fileName}\"
}
我正在寻找只查找文件的基本名称而不是全名的捷径。从理论上讲,我应该从根目录中查找其全名,以及与文件本身相关的名称。但是,我现在太懒了。最有可能的是,您不必为此担心。
,,棘手的。至少如果您必须考虑“正在使用”位。
如果是.cs,则可以使用import语句,这些语句不会轻易让您得出文件是否正在使用的结论。除非我弄错了(更像是Java家伙...),否则导入可能会在程序包级别进行。
而且我认为JavaScript和php文件的情况会更糟。
也许您应该问,为什么该报告首先具有价值?
,这只是草稿,您需要研究所有命令并执行自己的逻辑...
for file in $(find -type f -name \\*.extension); do
grep -Rl $file /in/path
done > /tmp/myfiles
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。