正则表达式学习笔记三

  • 后向引用

说明后向引用的之前,先对分组进行更一步的学习。

前面说过,用小括号括起来就是一个分组,或者叫子表达式,但是,其实分组并不是表面那么简单,有如下几条:

(1) 分组其实是有组号的。

从左到右,第一个分组组号为1,第二个组号为2,依次递增,分组0则对应整个正则表达式。

(2) 分组的组号分配是有规则的。

实际上组号分配过程是从左往右扫两遍:第一遍给未命名组分配,第二遍只给命名组分配,这样导致的结果就是所有命名组的组号大于为命名组的组号。

(3) 分组的组号分配这个权利是可以被剥夺的。

怎么剥夺?使用(?:exp)这样的语法。

说完了分组,有个疑问,分组还要弄组号这是做什么?还搞的这么麻烦。

答案就是,分组的组号是可以在正则表达式中使用的,比如说为了这个后向引用。

举个例子:如果你想要重复搜索前面某个分组匹配的文本怎么办?难道又重新写一遍分组?这里,就可以使用后向引用了。

请看例子:\b(\w+)\b\s+\1\b

这个表达式可以这样分解:

\b(\w+)\b \s+ \1\b

可以看到:我们要匹配的字符串是一个单词(至少一个字符),中间有至少有一个空白符,然后\1表示组号,即重复前面那个分组表示的单词。

这个正则表达式可以用来搜寻什么move move之类的。

再来重复一次后向引用:用于重复搜索前面出现的某个分组。

关于分组的组名,这里在多说几句。一个分组的组名是可以人为命名的。

使用语法:(?<word>\w+)

把尖括号改成也可以(?’word’\w+),这样\w+分组的组名就是word了。

要是想要后向引用这个分组匹配的文本怎么办?

可以使用\k<word>,例如:将\b(\w+)\b\s+\1\b写成\b(?<Word>\w+)\b\s+\k<Word>\b

小括号这个元字符的作用很多,与之相关的语法小结一下:

分类

语法

详解

捕获

(exp)

分组

(?<name>exp)

分组到名为“name“的分组里,与<?’name’exp>

(?:exp)

匹配exp,但是不捕获该文本,也不分配组号

零宽断言

(?=exp)

匹配exp前面的位置

(?<=exp)

匹配exp后面的位置

(?!exp)

匹配后面跟着的不是exp的位置

(?<!exp)

匹配前面不是exp的位置

注释

(?#comment)

注释

  • 零宽断言

解释下上述表里面的零宽断言部分的四条语法。

相信已经从表里面读到了,零宽断言是用来查找某些内容之前或者之后的东西,他们指定了一个位置,这个位置应该满足一定的条件(断言)。下面依次解释:

1(?=exp)

叫做零宽度正预测先行断言。

举例:\b\w+(?=ing\b)

解析:匹配以ing结尾的单词的文本并捕获出来,不包括ing

wKioL1V1O7bw16OlAABEO9oKfoE426.jpg

2(?<=exp)

叫做零宽度正回顾后发断言。

举例:(?<=\bre)\w+\b

解析:匹配以re开头的单词的后部分,不包括re

wKioL1V1O6rQrIcPAABBj7BFxpE784.jpg

3(?!exp)

叫做零宽度负预测先行断言。

举例:\d{3}(?!\d)

解析:匹配3个数字,但是3个数字后面不能是数字。

wKiom1V1OfqiRtz7AABKEPKLoKM993.jpg

4(?<!exp)

叫做零宽度负回顾后发断言。

举例:(?<![a-z])\d{7}

解析:前面不是小写字母的7个数字。

wKiom1V1OeLAGoN_AABRaFucGpE198.jpg

34项都属于负向零宽断言。

这里看一个复杂的正则表达式:

举例:(?<=<(\w+)>).*(?=<\/\1>)

解析:匹配不包含属性的简单HTML标签内里的内容

(<?(\w+)>)指定了这样的前缀:被尖括号括起来的单词(比如可能是<b>),然后是.*(任意的字符串),最后是一个后缀(?=<\/\1>)。注意后缀里的\/,它用到了前面提过的字符转义;\1则是一个反向 引用,引用的正是捕获的第一组,前面的(\w+)匹配的内容,这样如果前缀实际上是<b>的话,后缀就是</b>了。整个表达式匹配的是<b></b> 之间的内容(再次提醒,不包括前缀和后缀本身)。这个例子就是第一个语法和第二个语法的结合。

  • 注释

注释的语法我们已经知道:(?#comment),可以插入到正则表达式的任一个位置。唯一需要说明的是,使用注释的时候,最好能够启用“忽略模式里的空白符“,这样在写注释的时候就可以换行了。

  • 处理选项

处理选项,在PHP里面即是模式修饰符,作用就是设定模式。也就是规定了正则表达式如何解释和应用。不同的语言这个处理选项是不同的,这里主要说一说PHP里面的主要的模式。

修饰符

表达式写法

详解

I

(?i)…(?-i)(?i:..)

忽略大小写模式

M

(?m)…(?-m)(?m:..)

多文本模式,即字符串内有多个换行符,影响^$作用

s

(?s)…(?-s)(?s:..)

但文本模式,在此模式下,元字符点.可以匹配换行符

X

(?x)…(?-x)(?x:..)

忽略空白字符

模式修饰符既可以写在正则表达式的外面,也可以写在表达式内。

例如:

忽略大小写:

wKioL1V1O1GhkJNKAABIi4YLEgs249.jpg


  • 贪婪和懒惰

正则表达式里面有重复选择的元字符,例如*等,包含了这种玩意的正则表达式往往会匹配尽可能多的字符,这被称作贪婪匹配。

例如:a.*c

面对acacaac这样的字符串,返回的结果是acacaac,而不会是ac或者aac

wKioL1V1O3PBU1O7AAAlJQT19lI130.jpg

与上面相反,假设要是想要匹配尽量少的字符,这就被称作为懒惰。

举例:根据前面的a.*c,在.*后面加上?。

即为:a.*?c

wKiom1V1OcHBm8KoAAAstxLcDyw093.jpg

另外,根据上图,有点需要说明的是,懒惰和贪婪的规则优先级屈尊与这一条规则之下:最先开始的匹配拥有最高的优先权。所以在上面字符串acacaac的后面三个字符串aac共同构成了一个捕获文本,而不是ac(即倒数一二个)。

下面总结下懒惰限定符作用在重复次数上的作用:

语法

详解

*?

重复任意次,但是尽可能少。

+?

重复一次或者更多,但是尽可能少。

??

重复0次到1次,尽可能少。

{n,m}?

重复nm次,尽可能少。

{n,}?

重复n次,尽可能少。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


jquery.validate使用攻略(表单校验) 目录 jquery.validate使用攻略1 第一章&#160;jquery.validate使用攻略1 第二章&#160;jQuery.validate.js API7 Custom selectors7 Utilities8 Validato
/\s+/g和/\s/g的区别 正则表达式/\s+/g和/\s/g,目的均是找出目标字符串中的所有空白字符,但两者到底有什么区别呢? 我们先来看下面一个例子: let name = &#39;ye wen jun&#39;;let ans = name.replace(/\s/g, &#39;&#3
自整理几个jquery.Validate验证正则: 1. 只能输入数字和字母 /^[0-9a-zA-Z]*$/g jQuery.validator.addMethod(&quot;letters&quot;, function (value, element) { return this.optio
this.optional(element)的用法 this.optional(element)是jquery.validator.js表单验证框架中的一个函数,用于表单控件的值不为空时才触发验证。 简单来说,就是当表单控件值为空的时候不会进行表单校验,此函数会返回true,表示校验通过,当表单控件
jQuery.validate 表单动态验证 实际上jQuery.validate提供了动态校验的方法。而动态拼JSON串的方式是不支持动态校验的。牺牲jQuery.validate的性能优化可以实现(jQuery.validate的性能优化见图1.2 jQuery.validate源码 )。 也可
自定义验证之这能输入数字(包括小数 负数 ) &lt;script type=&quot;text/javascript&quot;&gt; function onlyNumber(obj){ //得到第一个字符是否为负号 var t = obj.value.charAt(0); //先把非数字的都
// 引入了外部的验证规则 import { validateAccountNumber } from &quot;@/utils/validate&quot;; validator.js /*是否合法IP地址*/ export function validateIP(rule, value,cal
VUE开发--表单验证(六十三) 一、常用验证方式 vue 中表单字段验证的写法和方式有多种,常用的验证方式有3种: data 中验证 表单内容: &lt;!-- 表单 --&gt; &lt;el-form ref=&quot;rulesForm&quot; :rules=&quot;formRul
正则表达式 座机的: 例子: 座机有效写法: 0316-8418331 (010)-67433539 (010)67433539 010-67433539 (0316)-8418331 (0316)8418331 正则表达式写法 0\d{2,3}-\d{7,8}|\(?0\d{2,3}[)-]?\d
var reg = /^0\.[1-9]{0,2}$/;var linka = 0.1;console.log (reg.test (linka)); 0到1两位小数正则 ^(0\.(0[1-9]|[1-9]{1,2}|[1-9]0)$)|^1$ 不含0、0.0、0.00 // 验证是否是[1-10
input最大长度限制问题 &lt;input type=&quot;text&quot; maxlength=&quot;5&quot; /&gt; //可以 &lt;input type=&quot;number&quot; maxlength=&quot;5&quot; /&gt; //没有效
js输入验证是否为空、是否为null、是否都是空格 目录 1.截头去尾 trim 2.截头去尾 会去掉开始和结束的空格,类似于trim 3.会去掉所有的空格,包括开始,结束,中间 1.截头去尾 trim str=str.trim(); // 强烈推荐 最常用、最实用 or $.trim(str);
正则表达式语法大全 字符串.match(正则):返回符合的字符串,若不满足返回null 字符串.search(正则):返回搜索到的位置,若非一个字符,则返回第一个字母的下标,若不匹配则返回-1 字符串.replace(正则,新的字符串):找到符合正则的内容并替换 正则.test(字符串):在字符串中
正整数正则表达式正数的正则表达式(包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+\d)|0)$正数的正则表达式(不包括0,小数保留两位): ^((0{1}.\d{1,2})|([1-9]\d.{1}\d{1,2})|([1-9]+
JS 正则验证 test() /*用途:检查输入手机号码是否正确输入:s:字符串返回:如果通过验证返回true,否则返回false /function checkMobile(s){var regu =/[1][3][0-9]{9}$/;var re = new RegExp(regu);if (r
请输入保留两位小数的销售价的正则: /(^[1-9]([0-9]+)?(\.[0-9]{1,2})?$)|(^(0){1}$)|(^[0-9]\.[0-9]([0-9])?$)/ 1.只能输入英文 &lt;input type=&quot;text&quot; onkeyup=&quot;value
判断价格的正则表达式 价格的正则表达式 /(^[1-9]\d*(\.\d{1,2})?$)|(^0(\.\d{1,2})?$)/; 1 解析:价格符合两种格式 ^ [1-9]\d*(.\d{1,2})?$ : 1-9 开头,后跟是 0-9,可以跟小数点,但小数点后要带上 1-2 位小数,类似 2,2
文章浏览阅读106次。这篇文章主要介绍了最实用的正则表达式整理,比如校验邮箱的正则,号码相关,数字相关等等,本文给大家列举的比较多,需要的朋友可以参考下。_/^(?:[1-9]d*)$/ 手机号
文章浏览阅读1.2k次。4、匹配中的==、an==、== an9、i9 == "9i"和99p==请注意下面这部分的作用,它在匹配中间内容的时候排除了说明:当html字符串如下时,可以匹配到两处,表示匹配的字符串不包含and且不包含空白字符。说明:在上面的正则表达式中,_gvim正则表达式匹配不包含某个字符串
文章浏览阅读897次。【代码】正则表达式匹配a标签的href。_auto.js 正则匹配herf