如何解决在python中使用正则表达式时如何忽略“ \ n”
我对正则表达式以及http请求和使用python获取网页非常陌生。我试图获取网页并找到p标签中的所有部分,但搜索失败,因为要获取的html具有\ n。这是我到目前为止的代码:
# Search for link values within URL input
import urllib.request,urllib.parse,urllib.error
import re
import ssl
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE
url = input('Enter - ')
html=urllib.request.urlopen(url,context=ctx).read()
print(html)
areas=re.findall(b"(?m)<p>.+</p>",html)
print(len(areas))
for i in range(len(areas)):
print(areas[i].decode)
使用网站:https://dr-chuck.com/page1.htm
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。