如何解决当我检查网址列表时出现HTTP错误403:禁止错误
我是python的新手。我试图从存储在xlsx文件中的URL列表中检查损坏的URL。并且前几个url运行良好,但随后停止并显示“ HTTP错误403:禁止访问”。我不确定这是否是“用户代理”的问题。我尝试了几种方法,但是没有用。希望你能看到我代码的哪一部分是错误的。
这是我的代码的一部分:
import pandas as pd
import urllib.request
import time
file = pd.read_excel('tests.xlsx')
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent','Mozilla/49.0.2')]
error_url=[]
for i in range(0,len(file)):
url=file.values[i][0]
test = urllib.request.urlopen(url).read()
try :
opener.open(url)
print(url+' : succeed')
if 'scholarship' in test.decode() or 'award' in test.decode():
print(" Yes")
else:
print("No")
错误是这样的: error message
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。