如何解决正则表达式与有效IPv4地址的混淆
我正在尝试编写一个Regex表达式,用于从包含许多有效,无效(两种)地址类型的文件中选择有效的IPv4地址。 我已经为此写了Regex,但是仍然打印出两个无效的IPv4地址-255.255.256.255和8.234.88,55 谁能帮助我了解为什么这两个我用我输入的正则表达式打印出来。
.LC0:
.string "%d"
.LC1:
.string "foo.baz == 1"
.LC2:
.string "foo.baz != 1"
main:
push rbp
mov rbp,rsp
sub rsp,16
lea rax,[rbp-1]
mov rsi,rax
mov edi,OFFSET FLAT:.LC0
mov eax,0
call scanf
movzx eax,BYTE PTR [rbp-1]
and eax,1
test al,al
je .L2
mov edi,OFFSET FLAT:.LC1
call puts
jmp .L3
.L2:
mov edi,OFFSET FLAT:.LC2
call puts
.L3:
mov eax,0
leave
ret
我正在使用此正则表达式通过包含下面列出的IPv4地址的文件过滤有效的IPv4地址。
((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)
我想知道为什么此正则表达式与255.255.256.255和8.234.88,55 IPv4地址匹配。
解决方法
为什么此正则表达式表达式与255.255.256.255和8.234.88,55 IPv4地址匹配。
不是。它匹配该字符串的一部分。您最有可能做到了:
Option Explicit
Sub dtToFormula()
Dim R As Range,C As Range
Dim vDateParts(2)
Set R = [a1:a10]
'Set R = ActiveCell 'or Selection whatever range you want to convert
For Each C In R
If IsDate(C) And Not C.HasFormula Then
vDateParts(0) = Year(C.Value2)
vDateParts(1) = Month(C.Value2)
vDateParts(2) = Day(C.Value2)
C.Formula = "=DATE(" & Join(vDateParts,",") & ")"
End If
Next C
End Sub
是的,它有效。但是模式与整体不匹配,它分别与部分$ echo '255.255.256.255' | grep -E '((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)'
255.255.256.255
和255.255.25
匹配。 6.255
仅允许第一部分匹配一次或两次,而不必匹配3次。喜欢:
{1,3}
由于 ((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.)((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.)(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)
25 5 . 25 5 . 2 5 6.255
^^^^^ - left over
,第一部分只能匹配一次。因为{1,3}
将正则表达式应用于字符串的一部分,并且由于匹配了完整的正则表达式,所以将打印该行。
类似地,对于grep
,部分8.234.88,55
被匹配,而8.234.88
不匹配。很酷的看到:
,55
要匹配整行,请执行$ echo '8.234.88,55' | grep --color -E '(((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){1,3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)){1}'
8.234.88,55
^^^^^^^^ - is red
或添加锚点grep -x
,或者您很可能要将^....$
更改为{1,3}
,以精确匹配3个部分。
(((25 [0-5] | 2 [0-4] [0-9] | [01]?[0-9] [0-9]?)\\。)
我已经尝试过用C ++表示。 在此处解决逗号问题之前,在圆点之前添加一个额外的斜杠。
它解析了一个逗号,因为您缺少斜杠,因为它的编写方式将点解释为“解析除EOL之外的任何字符”。
同样,当您输入[01]时,表达式允许值以0开头吗?
有人建议如何处理该表达式:如果该表达式只有一位数字,怎么写?然后是2位数字,然后是3位数字...
(([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\\.){3}([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])
,
您的正则表达式未锚定在字符串的开头和结尾。它匹配每行的片段,而不是整个行的片段。
将regex
放在^
和$
之间。
^
匹配字符串的开头; $
匹配字符串的结尾。
如果启用了多行匹配,则^
匹配行的开头,$
匹配行的结尾。
此外,regex
稍有不正确,这使它的匹配程度低于应有的程度。 IPv4地址始终具有4个组成部分。由于{1,3}
,您的regex
允许2到4个组件。结合缺乏锚点,它可以在您提到的行中找到两个匹配项。
看看regex101.com。
regex
应该是:
^((25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。