学习笔记:文本过滤_____unix 下的通配符

有个文件 test.txt 内容如下:

bash-3.00$ cat test.txt 
        user
  user
   user_hi
user
#注:呢行系空行
T
J
GATEMAN
GATTTTTEMAN
GABBEMAN
AAAB
bash-3.00$ 

下面介绍下常用的通配符 配合grep 命令:
1.   "."   匹配单字符
例如:
bash-3.00$ grep -n u..r test.txt 
1:      user
2:  user
3:   user_hi
4:user
bash-3.00$ grep -n u..r.h.. test.txt     #匹配唔成功
bash-3.00$ grep -n u..r.h. test.txt 
3:   user_hi


==========================================================================
2.  ”^" 匹配行首
例如:
bash-3.00$ grep -n ^u test.txt 
4:user                                          #只匹配到第4行, 因为^u 表示以u开头的行,不包括以空格和tab开头的行
bash-3.00$ grep -n ^u.e test.txt    # 和. 配合使用
4:user

==========================================================================
3. "$" 匹配行尾
例如:
bash-3.00$ grep -n er$ test.txt                      #以er结尾的行
1:      user
2:  user
4:user
bash-3.00$ grep -n ^u..r$ test.txt                  #配合^使用  以u开头 中间有2个字符 而且 r结尾的行
4:user
bash-3.00$ grep -n ^$ test.txt                       #  ^$ 只匹配空行  不包括有空格的行(第5行)
5:
bash-3.00$ grep -n ^.$ test.txt                      # 匹配只有1个字符的行(第6行只有1个字符T)
6:T
bash-3.00$ grep -n ^..$ test.txt                      # 匹配有且只有2个字符的行(第7行只有2个字符:空格 和 J)
7: J

==========================================================================
4. "*" 匹配单字符 或重复队列
例如:
bash-3.00$ grep -n * test.txt                               #单独使用 *什么也匹配不到
bash-3.00$ grep -n ^k* test.txt                            #匹配以n个k开头的行 n>=0  因为包含0个k开头的行,所以实际上匹配所有行
1:      user
2:  user
3:   user_hi
4:user
5:
6:T
7: J
8:GATEMAN
9:GATTTTTEMAN
10:GABBEMAN
bash-3.00$ grep -n us*e..h*i$ test.txt     #未指定开头,含有1个u,后面跟0个或n个s,跟着e,跟住2个字符,跟住0个或n个h,i结尾    
3:   user_hi
bash-3.00$ grep -n GAT*..AN$ test.txt   #你懂的  0个或N个T
8:GATEMAN
9:GATTTTTEMAN

gateman@GPC:~/shell$ grep -n G.*MAN test.txt # .*组合使用 常用的来了 意思是G后面跟任意字符 任意次..
8:GATEMAN
9:GATTTTTEMAN
10:GABBEMAN

==========================================================================
5.   ”\“ 屏蔽一个特殊字符的含义
有时需要查找一些字符或字符串,而它们包含了系统指定为特殊字符的一个字符。什么
是特殊字符?一般意义上讲,下列字符可以认为是特殊字符:
¥ ., () {} [] * ^ % $.....
假定要匹配包含字符“.”的各行而 "." 代表匹配任意单字符的特殊字符,因此需要屏蔽
其含义。操作如下:
\ .
上述模式不认为反斜杠后面的字符是特殊字符,而是一个普通字符,即句点。
假定要匹配包含^的各行,将反斜杠放在它前面就可以屏蔽其特殊含义。如下:
\ ^
如果要在正则表达式中匹配以* . p a s结尾的所有文件,可做如下操作:
\ * \ . p a s
即可屏蔽字符*的特定含义。
==========================================================================

6.  "[ ]" 匹配1个集合
如:
gateman@GPC:~/shell$ grep -n u[Ss]er test.txt                 #匹配大写 S或小写s
1:    user
2:  user
3:   user_hi
4:user

为抽取诸如S c o u t、s h o u t、b o u g h t等单词,使用下列表达式:
[ou] .*t
匹配以字母o或u开头,后跟任意一个字符任意次,并以t结尾的任意字母。
也许要匹配所有包含s y s t e m后跟句点的所有单词,这里S可大写或小写。使用如下操作:
[ S,s ] y s t e m \ .
[ ]在指定模式匹配的范围或限制方面很有用。结合使用*与[ ]更是有益,例如[ A - Z a - Z ] *将
匹配所有单词。
[ A - Z a - z ] *
注意^符号的使用,当直接用在第一个括号里,意指否定或不匹配括号里内容。
[^a-zA-Z]
匹配任一非字母型字符,而
[ ^ 0 - 9 ]
匹配任一非数字型字符。
==========================================================================
7. "\{\}" 指定匹配次数

例如:
gateman@GPC:~/shell$ grep -n  AT\{1\}E test                            #一定要带“ ”号,否则无结果  
gateman@GPC:~/shell$ grep -n "AT\{1\}E" test.txt                      #只跟1个T
8:GATEMAN
gateman@GPC:~/shell$ grep -n "A\{1,\}B" test.txt                      #1个或以上的A跟住B  例如AB AAB AAAB..
10:GABBEMAN
11:AAAB
gateman@GPC:~/shell$ grep -n "A\{1\}B" test.txt                       #只匹配AB, 注意:  AAAB 包含AB
10:GABBEMAN
11:AAAB

gateman@GPC:~/shell$ grep -n "^A\{1,2\}B" test.txt      #1~2个A ,只匹配AB 和AAB 并且以A开头, 注意:  AAAB 不符
gateman@GPC:~/shell$ grep -n "^A\{1,3\}B" test.txt      #这个就可以稳出来了.
11:AAAB



原文地址:https://www.cnblogs.com/nvd11/archive/2013/04/02/2996942.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


系ubuntu 下面打开终端输入:sudo apt-get install sendmail一般就安装完成噶啦跟住进入 /etc/mail/目录输入:m4 sendmail.mc > sendmail.cf意思系跟住.mc文件 生成 sendmial.cf文件输入呢个命令:ps aux | g
依家我有1个软件goagent目录(大家懂得) 放在/home/gateman/Programs/ 下 1. proxy.py 入面有1个 proxy.py 文件 放在/home/gateman/Programs/goagent/local/ 入面 2.breakwall.sh 我在 proxy.p
其实我想讲的是 cp -L关于-L参数的解释:-L, --dereference always follow symbolic links in SOURCE意思是如果复制目标是1个软链接,则复制链接的目标 不是链接本身做个例子: 例如 ~/tmp/fo1 入面有1个c.txt 文件 和 指向他的软
原地址:http://www.rjgc.net/control/content/content.php?nid=4418 1、将文件checkout到本地目录svn checkout path(path是服务器上的目录)例如:svn checkout svn://192.168.1.1/pro/do
chroot,即 change root directory (更改 root 目录)。在 linux 系统中,系统默认的目录结构都是以 `/`,即是以根 (root) 开始的。而在使用 chroot 之后,系统的目录结构将以指定的位置作为 `/` 位置。实例:用live CD ubuntu假设你的
简单解析下, stdin就是标准输入, stdout就是标准。举个例子, 在当前我要打包1个文件夹 /var/log/ 到当前目录下,并用zip压缩,那么我们可以分步执行#tar -cvf log.tar /var/log/#zip -r log.tar.zip log.tar#rm -rf log
转自:http://man.ddvip.com/linux/Mandrakelinuxref/process-priority.html系统中运行的每个进程都有一个优先级(亦称“nice 值”),其范围从 -20 (最高优先级)到 19 (最低优先级)。默认情况下,进程的优先级是 0 (“基本”调度
str="/home/gateman" if [ ${str:0:1} = "/" ]; then echo "yes'fi ${str:0:1} 中0表示从第几个字符开始,1表示截取多长
转自:http://kwokchivu.blog.51cto.com/1128937/694347 在RedHat系统下用usermod 命令可把某用户添加进多个附属组,默认情况下,一次性添加多个附属组可用以下方式来添加: usermod -G 附属组1,附属组2,...,附属组X 用户名 但在添加
有个文件 test.txt 内容如下:bash-3.00$ cat test.txt user user user_hiuser #注:呢行系空行T JGATEMANGATTTTTEMANGABBEMANAAABbash-3.00$下面介绍下常用的通配符 配合grep 命令:1. ".&q
linux系统为每1个文件都分配有i索引节点(inode),系统根据呢d节点从磁盘找出数据。 一般来讲,每1个文件名(包含全路径)实际上都链接住1个i索引节点。inode实际上系乜咧? 其实可以算系1个指向磁盘具体位置(柱面,扇区之类)的指针, 系统分析某个文件的inode,得出磁盘柱面,扇区等数据
grep 可以立即为筛选, 一般的用法系 grep + 要查询的字段 + 文件(或者内容 例如| 传递既内容)1.grep + 要查询的字段 + 文件gateman@GPC:~/shell/SQL_GSI$ grep OID a.sqlWHERE OID=@BuildNOWHERE OID INWH
原文转自:http://www.ibm.com/developerworks/cn/linux/l-cn-vimcolumn/index.html开始之前人类大脑对文字的处理是平面式的,所以我们浏览文章、查找资料或者重构代码,要么是横向读,要么是纵向读,要么使用搜索功能,将文字作为一个平面整体。而在
PS:偶很喜欢用scp这个命令来传输数据。scp命令跟cp命令类似,只不过cp命令是在同一台机器上用的,scp是在两台机器上复制传输数据的命令。scp实质相当于利用SSH协议来传输数据的cp命令。 用法举例: 1、复制远程服务器的文件到本地: scp -P888 root@120.18.50.33:
打开终端,进入/bin/ls 一下会见到 bash sh 呢两个文件。其实距地系两个唔同既shell 解析器。如果在脚本a.sh 开头写入#!/bin/sh那么执行./a.sh 时候 就相当于 sh a.sh同理 开头写入#!/bin/bash执行./a.sh 时候 就相当于 bash a.sh如果
find查找文件的时候排除某个或几个文件或目录转自:http://www.cnblogs.com/starspace/archive/2008/10/20/1315380.html比如要在/usr/sam目录下查找不在dir1子目录之内的所有文件find /usr/sam -path "/
假设有变量 var=http://www.google.com/test.htm一 # 号截取,删除左边字符,保留右边字符。echo ${var#*//}其中 var 是变量名,# 号是运算符,*// 表示从左边开始删除第一个 // 号及左边的所有字符即删除 http://结果是 :www.goog
转自: http://edyfox.codecarver.org/html/_vimrc_for_beginners.htmlVIM 中可供用户定制的选项非常非常多,作为初学者,我们没有必要了解这么多东西。下面,滇狐简单列出了一些最常用的配置项,大家可以根据自己的需要将这些内容添加到自己的 .vim
转自:http://www.einit.com/user1/11/archives/2006/3603.htmlUnix/Linux下一般想让某个程序在后台运行,很多都是使用 & 在程序结尾来让程序自动运行。比如我们要运行mysql在后台: /usr/local/mysql/bin/mysq
首先, mount是类unix系统, 挂载设备到1个文件夹的操作命令, 注意系设备阿正常来讲,mount 是不能挂在文件夹到文件夹的。例如, 在我的~/tmp/ 目录中有两个文件夹fo1 fo2其中fo1 中有3个文件a.txt b.txt c.txt fo2 有4个 e.txt d.txt e.t