1、匹配a标签及其url:
Regex regA = new Regex(@"<a[\s]+[^<>]*href=(?:""|')([^<>""']+)(?:""|')[^<>]*>([^<>]+)</a>",RegexOptions.IgnoreCase);
说明:在上面的正则表达式中,
用来匹配href属性前面和后面的各种属性:
[^<>]*
用来匹配href属性引号中间的url:
([^<>""']+)
用来匹配a标签之间的内容:
([^<>]+)
2、匹配img标签及其url:
Regex regImg = new Regex(@"<img[\s]+[^<>]*src=(?:""|')([^<>""']+(?:\.jpg|\.jpeg|\.png|\.gif))(?:""|')[^<>]*>",RegexOptions.IgnoreCase);
3、匹配标签及标签中间的内容:
reg = new Regex(@"<dl class=""ksDl"">(?:(?!</dl>)[\s\S])*</dl>",RegexOptions.IgnoreCase);
或:
reg = new Regex(@"<dl class=""ksDl"">(?:(?!class=""ksDl"")[\s\S])*</dl>",RegexOptions.IgnoreCase);
说明:当html字符串如下时,可以匹配到两处,
<dl class="ksDl"><div>测试</div></dl>
<dl class="ksDl"><div>测试</div></dl>
如果正则表达式这样写:
reg = new Regex(@"<dl class=""ksDl"">[\s\S]*</dl>",RegexOptions.IgnoreCase);
则只能匹配一处。请注意下面这部分的作用,它在匹配中间内容的时候排除了</dl>
(?:(?!</dl>)[\s\S])*
4、匹配<#if == and an== and == an9 and i9 == "9i" and 99p==>中的==、an==、== an9、i9 == "9i"和99p==
Regex reg = new Regex(@"([\s]+(?:and){0,1}(?:(?!and)[^\s])*[\s]*==[\s]*(?:(?!and)[^\s>])*[\s]*)",RegexOptions.IgnoreCase);
说明:
(?:(?!and)[^\s])*
表示匹配的字符串不包含and且不包含空白字符
原文地址:https://blog.csdn.net/lwf3115841/article/details/128583583
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。