如何解决修改文件中的文本数百万列,制表符分隔-删除除第一个选项卡外的所有选项卡,并在最后一列之后添加新列
| 在这里,我希望您对文本文件的修改有所帮助。 我想修改文件中的文本(数百万列,以制表符分隔)-删除除第一个以外的所有选项卡,并在最后一列后面添加新列。 文件(此处有4列,但 我的真实文件中有数百万列 制表符分隔)我现在有:day1 1 3 7
day7 2 4 8
day3 2 5 6
我要的文件,删除分隔符
(从第二个开始),然后添加三个
新列(一个与
第一个,其他两个相同
所有同一列中的值,此处为x
和y)。
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
我打算用awk和sed混合使用。但是,我尝试了许多不同的方法,但我仍然不这样做。
你能给我任何帮助吗?提前致谢。
最好,
解决方法
使用
gawk -f script.awk < input > output
,其中script.awk
包含:
{
old=$1;
$0 = substr($0,length($1)+1);
gsub(/[[:space:]]*/,\"\",$0);
print old,$0,old,\"x\",\"y\";
}
在此处观看现场演示(感谢belisarius向我展示此网站)
, 这个问题被标记为[perl],因此出于完整性考虑:
#! /usr/bin/perl -lan
BEGIN { $,= \"\\t\" }
$first = shift @F;
print $first,join(\"\",@F),$first,qw/ x y /;
该程序使用了几个便利功能来保持简洁。
将$,
设置为TAB字符,类似于awk中的FS
-l
开关会将\"\\n\"
隐式地添加到每个print
,其工作方式类似于awk中的ORS
-a
(自动分割或awk模式)开关
当与-n
或-p
一起使用时,打开自动分割模式。对@F
数组的隐式split
命令是由-n
或-p
产生的隐式while循环内的第一件事。
perl -ane \'print pop(@F),\"\\n\";\'
相当于
while (<>) {
@F = split(\' \');
print pop(@F),\"\\n\";
}
ѭ13开关隐式循环输入的所有行
使Perl在您的程序周围假设以下循环,从而使其遍历文件名参数,例如sed -n
或awk
:
LINE:
while (<>) {
... # your program goes here
}
, 这可能对您有用:
sed \'s/\\t//2g;s/\\(.*\\t\\)\\(.*\\)/&\\t\\1x\\ty/\' file
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
我猜是因为它是一个制表符分隔的文件,所以您希望将新列用制表符分隔。如果不:
sed \'s/\\t//2g;s/\\(.*\\)\\t\\(.*\\)/& \\1 x y/\' file
day1 137 day1 x y
day7 248 day7 x y
day3 256 day3 x y
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。