如何解决pytube错误-get_ytplayer_config:传递URL列表时找不到config_patterns的匹配项
我正在尝试使用pytube从一个YouTube频道传递URL列表,以便提取YouTube元数据的某些位进行分析。这是我正在使用的代码:
import pandas as pd
from pytube import YouTube
url_list = pd.read_csv("data.csv").values
“ data.csv”只是一列,其中仅包含约2000个YouTube格式的URL。据我所知,没有一个视频是私有的。
data = pd.DataFrame(columns = ['title','views','description','length','rating'])
lists = []
for url in url_list:
try:
urls = str(url)
yt = YouTube(urls)
lists.append([yt.title,yt.views,yt.description,yt.length,yt.rating])
except Exception as e:
lists.append(['NA','NA','NA'])
print(e)
这里的问题是YouTube是否会返回我需要的值,这是一个难题!可以正常工作的URL会很好地附加到列表中,但如果不能,则为:
RegexMatchError: get_ytplayer_config: could not find match for config_patterns
最终,在第一次发生此错误后,我也为每个URL都收到此错误:
HTTP Error 429: Too Many Requests
我尝试使用BeautifulSoup,但同时也会遇到一些令人沮丧的“资产”错误:
MissingSchema: Invalid URL 'u': No schema supplied. Perhaps you meant http://u?
如果有人可以提出解决此问题或替代方法的任何建议,那将是很棒的,因为我一直在努力寻找解决方案。
解决方法
此错误 (RegexMatchError:get_ytplayer_config:找不到config_patterns的匹配项)是由于Pytube的已知问题。
尝试更新request.py
https://github.com/nficano/pytube/issues/614 https://github.com/nficano/pytube/issues/614#issuecomment-724326141
或 更好地安装PyTube pkg的最新固定版本 https://github.com/nficano/pytube/issues/815#issuecomment-725747111
在安装更新的pkg之后,此问题已为我解决。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。