基本正则表达式和文本处理工具之grep、egrep和fgrep

基本正则表达式和文本处理工具之grep、egrep和fgrep

Grep(global search regular expression and print out the line全局搜索正则表达式并把行打印出来),是一种强大的文本搜索工具,egrep和fgrep的命令跟grep只有很少的差别,linux使用的是GNU版本的grep,功能非常强大,可以通过-G,-E,-F命令选项来使用egrep和fgrep的功能,grep的工作方式为在一个或多个文件中搜索字符串模板,如果模板包括空格则必须被引用,模板后的所有字符串被看做文件名,搜索的结果被送到屏幕,不影响元文件内容,grep搜索成功返回值为0,搜索不成功返回值为1,如果搜做的文件不存在则返回值为2,因此grep可以用于脚本来进行一些自动化的文本处理工作。


Grep常用参数:

-i:忽略大小写

-v:取反,即得到的结果与设置的要求是相反的

-n:输出结果时候显示行号


常用的基本在正则表达式:

^ 行首

$ 行末

[] 匹配指定的字符

[^] 匹配指定以外的字符

\< 单词首

\> 单词尾

\(a,\)..\n 分组并引用

^$ 空白行

[0-9],[[:digit:]] 任意数字

[a-z],[[:lower:]] 任意小写字母

[A-Z],[[:upper:]] 任意大写字母

[[:alpha:]] 所有的大小写字母,全行匹配

[[:alnum:]] 所有的大小写字母和数字

[[:space:]] 所有的空白字符

[[:punct:]] 所有的标点符号

* 匹配其前面的字符0次或任意次

| 或,比如a|b

.* 匹配任意长度的任意字符

\? 匹配之前的字符0次或一次

\{1\} 精确匹配多少次

\{1,\} 最少匹配多少次

\{0,m\} 最多匹配第三次

\{n,m\} 匹配n到m次

gt 大于

lt 小于

ge 大于等于

le 小于等于

ne 不等于

eq 等于

$0 脚本本身

$1 脚本第一个参数

$*,$@ 引用的所有参数

$# 位置参数的格式,多少行



分组和引用:字符分组以它们的左括号的出现顺序来排序,例如在表达式((1)(2(3))),有四个分组,第0组永远表示表达式本:

1、((1)(2(3)))

2、(1)

3、(2(3))

4、(3)


一、字符匹配:

1、. 用于匹配任意的单个字符,必须要有这个字符,固定.的位置匹配结果

[root@localhost ~]# grep 'ro.t' /etc/passwd

root:x:0:0:root:/root:/bin/bash

operator:x:11:0:operator:/root:/sbin/nologin


2、[] 匹配里面的任意单个字符,匹配全行

[root@localhost ~]# grep [wp] /etc/fstab

# See man pages fstab(5),findfs(8),mount(8) and/or blkid(8) for more info

UUID=16f1df10-ed2b-488b-9086-a48c60ab9ebe swap swap defaults 0 0

tmpfs /dev/shm tmpfs defaults 0 0

devpts /dev/pts devpts gid=5,mode=620 0 0

proc /proc proc defaults 0 0

/dev/cdrom /var/ftp/pub/ iso9660 defaults,ro,loop 0 0


3、[0-9],[[:digit:]]表示匹配从0-9其中的任意一个数字,全行匹配

[root@localhost ~]# grep [[:digit:]] 1.txt 1

64

676


4、[a-z],[[:lower:]] 匹配a-z任意一个小写字母,整行匹配

[root@localhost ~]# grep [ae-z] 1.txt #匹配字母a和e到z,把b和c去除

hI

hIlucy

asdxx


5、[A-Z],[[:upper:]] 匹配任意一个大写字母,全行匹配

[root@localhost ~]# grep [[:upper:]] 1.txt

HI

hIlucy


6、[[:alpha:]] 所有的大小写字母,全行匹配

[root@localhost ~]# grep [[:alpha:]] 1.txt

hi

asdxx

2w


7、[[:alnum:]] 所有的数字和大小写字母,全行匹配

[root@localhost ~]# grep [[:alnum:]] 1.txt

hi

HI

hIlucy

1

2fg


8、[[:space:]] 所以的空白字符,全行匹配

[root@localhost ~]# grep [[:space:]] 1.txt

asdxx

]

1 2

asd


9、[[:punct:]] 匹配所以的标点符号,全行匹配

[root@localhost ~]# grep [[:punct:]] 1.txt

,

]

[][

1.2


二:次数匹配,用来匹配字符出现的字数

1、*匹配*前面的那一个字符没有出现或者出现任意次,本例代表2没出现或出现多次,即1开头,1后面可以跟2,也可以不跟2,即使2后面还有字符,只有匹配到第一个1就算匹配到,而显示出来,所以其匹配到要么两个相同字符,要么没有

[root@localhost ~]# grep '12*' 1.txt

1

1223

111

w1

i12

1.2


2、.*匹配从.开始包含.在内的0或任意次数,本例为以12为开头,后面跟任意字符任意次数,即指定12必须匹配,与*最大的不同是.*往后匹配字符,后面有没有字符都匹配,而*则先往前匹配一位字符,其前面的一位字符如能匹配就出现两个同样字符,如果不能匹配就把前面字符取消,相比较之下*匹配的范围更大

[root@localhost ~]# grep '12*1' 1.txt

12221

111

3、\? 匹配前面的字符0次或一次,本例匹配12后面的2,有或者有一次即可,与*最大的区别是\?同一个字符最多连续出现两次,而*可以连续出现无数次

[root@localhost ~]# grep '12\?1' 1.txt

111


4、\{m\};匹配其前面的字符m次,需完成匹配次数

[root@localhost ~]# grep --color=auto '12\{3\}' 1.txt

12221

12222221


5、\{m,\}:匹配前面的字符至少m次

wKioL1P-CmnwoYZYAACPUU4KZmw528.jpg


6、\{m,n}:匹配前面的字符m-n次,如本例匹配前面的2的次数为2次、3次、4次

wKiom1P-CYrgBT3tAABd3xokfPo748.jpg


7、\{0,m\}\ 匹配前面的字符至多m次,即包含最对次以内的0次以上的所有次数

wKioL1P-Cquj-zYzAACD-rZ0TTY515.jpg


8、匹配以R1r开头,32结尾,中间间隔任意两个字符串的组合结果

wKiom1P-CbGhq3NpAABk78Sz0sg313.jpg

三:位置锚定,即指定要匹配的字符串在行中的具体位置,比如在一行的首部、中间、或者最后的位置

1、^指定匹配的字符串位置在行首

wKiom1P-CjmxiP_BAABEKdGPIYw230.jpg


2、$指定匹配的字符串位置在行尾

wKioL1P-C5GCmOlWAACM7N3m_dA950.jpg


3、^$ 指定匹配的字符串为空白行,后面的wc �l为统计行数,即共有96个空白行

wKiom1P-CvGzCuW2AAA4wvyWsBQ770.jpg


4、\< 指定匹配的字符串的词首

wKioL1P-DDqiMvygAACNnqytO-I998.jpg

5、\>指定匹配的字符串的词尾

wKiom1P-CzbQbOI1AABvg7xMwiE281.jpg

即指定词首又指定词尾,等于把一个单词固定了

wKioL1P-DGKiPpxAAABiVdlhp5E821.jpg


6、\(ab\)*xy\1 分组和引用,\1为引用的从左边开始的第几个括号里面所匹配到内容

wKioL1P-DHPBWF-UAABsiQDqV1M618.jpg

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


jquery.validate使用攻略(表单校验) 目录 jquery.validate使用攻略1 第一章&#160;jquery.validate使用攻略1 第二章&#160;jQuery.validate.js API7 Custom selectors7 Utilities8 Validato
/\s+/g和/\s/g的区别 正则表达式/\s+/g和/\s/g,目的均是找出目标字符串中的所有空白字符,但两者到底有什么区别呢? 我们先来看下面一个例子: let name = &#39;ye wen jun&#39;;let ans = name.replace(/\s/g, &#39;&#3
自整理几个jquery.Validate验证正则: 1. 只能输入数字和字母 /^[0-9a-zA-Z]*$/g jQuery.validator.addMethod(&quot;letters&quot;, function (value, element) { return this.optio
this.optional(element)的用法 this.optional(element)是jquery.validator.js表单验证框架中的一个函数,用于表单控件的值不为空时才触发验证。 简单来说,就是当表单控件值为空的时候不会进行表单校验,此函数会返回true,表示校验通过,当表单控件
jQuery.validate 表单动态验证 实际上jQuery.validate提供了动态校验的方法。而动态拼JSON串的方式是不支持动态校验的。牺牲jQuery.validate的性能优化可以实现(jQuery.validate的性能优化见图1.2 jQuery.validate源码 )。 也可
自定义验证之这能输入数字(包括小数 负数 ) &lt;script type=&quot;text/javascript&quot;&gt; function onlyNumber(obj){ //得到第一个字符是否为负号 var t = obj.value.charAt(0); //先把非数字的都
// 引入了外部的验证规则 import { validateAccountNumber } from &quot;@/utils/validate&quot;; validator.js /*是否合法IP地址*/ export function validateIP(rule, value,cal
VUE开发--表单验证(六十三) 一、常用验证方式 vue 中表单字段验证的写法和方式有多种,常用的验证方式有3种: data 中验证 表单内容: &lt;!-- 表单 --&gt; &lt;el-form ref=&quot;rulesForm&quot; :rules=&quot;formRul
正则表达式 座机的: 例子: 座机有效写法: 0316-8418331 (010)-67433539 (010)67433539 010-67433539 (0316)-8418331 (0316)8418331 正则表达式写法 0\d{2,3}-\d{7,8}|\(?0\d{2,3}[)-]?\d
var reg = /^0\.[1-9]{0,2}$/;var linka = 0.1;console.log (reg.test (linka)); 0到1两位小数正则 ^(0\.(0[1-9]|[1-9]{1,2}|[1-9]0)$)|^1$ 不含0、0.0、0.00 // 验证是否是[1-10
input最大长度限制问题 &lt;input type=&quot;text&quot; maxlength=&quot;5&quot; /&gt; //可以 &lt;input type=&quot;number&quot; maxlength=&quot;5&quot; /&gt; //没有效
js输入验证是否为空、是否为null、是否都是空格 目录 1.截头去尾 trim 2.截头去尾 会去掉开始和结束的空格,类似于trim 3.会去掉所有的空格,包括开始,结束,中间 1.截头去尾 trim str=str.trim(); // 强烈推荐 最常用、最实用 or $.trim(str);
正则表达式语法大全 字符串.match(正则):返回符合的字符串,若不满足返回null 字符串.search(正则):返回搜索到的位置,若非一个字符,则返回第一个字母的下标,若不匹配则返回-1 字符串.replace(正则,新的字符串):找到符合正则的内容并替换 正则.test(字符串):在字符串中
正整数正则表达式正数的正则表达式(包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+\d)|0)$正数的正则表达式(不包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+
JS 正则验证 test() /*用途:检查输入手机号码是否正确输入:s:字符串返回:如果通过验证返回true,否则返回false /function checkMobile(s){var regu =/[1][3][0-9]{9}$/;var re = new RegExp(regu);if (r
请输入保留两位小数的销售价的正则: /(^[1-9]([0-9]+)?(\.[0-9]{1,2})?$)|(^(0){1}$)|(^[0-9]\.[0-9]([0-9])?$)/ 1.只能输入英文 &lt;input type=&quot;text&quot; onkeyup=&quot;value
判断价格的正则表达式 价格的正则表达式 /(^[1-9]\d*(\.\d{1,2})?$)|(^0(\.\d{1,2})?$)/; 1 解析:价格符合两种格式 ^ [1-9]\d*(.\d{1,2})?$ : 1-9 开头,后跟是 0-9,可以跟小数点,但小数点后要带上 1-2 位小数,类似 2,2
文章浏览阅读106次。这篇文章主要介绍了最实用的正则表达式整理,比如校验邮箱的正则,号码相关,数字相关等等,本文给大家列举的比较多,需要的朋友可以参考下。_/^(?:[1-9]d*)$/ 手机号
文章浏览阅读1.2k次。4、匹配中的==、an==、== an9、i9 == "9i"和99p==请注意下面这部分的作用,它在匹配中间内容的时候排除了说明:当html字符串如下时,可以匹配到两处,表示匹配的字符串不包含and且不包含空白字符。说明:在上面的正则表达式中,_gvim正则表达式匹配不包含某个字符串
文章浏览阅读897次。【代码】正则表达式匹配a标签的href。_auto.js 正则匹配herf