正则表达式,应该都不陌生,但能真正用的熟的估计也没几个了,以下我的一些笔记
以python为主
#!/usr/bin/python # -*- coding:GBK -*- import re #1,获取字符串中的某一段,注意有些字符需要转义 s = '<title>测试标题</title>' print re.findall(r'\<title>(.*?)\</title>',s) #2,获取字符串中的数字,会将一行字符串中的分成数组 s='测试标题12,测试标题34测试标题7223' print re.findall('\d+',s) #3,获取字符串中匹配且包含自身的 s = '<title>测试标题</title>' print re.findall("<title.*?\/title>",s); #4获取Html中的A标签,且target=“_blank”和Href以href="/showcase/开始 s='<a target="_blank" href="/showcase/2263.shtml"></a>' print re.findall('<a[\\s]+target="_blank"[\\s]+href="/showcase/.*?\/a>',s) #获取名字为下一页的a标签 s='下一页' print re.findall('<a.*?下一页',s) #获取页面所有img标签 print re.findall('<img\s+src="([^"]*)".*?>',s)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。