如何解决使用Wget从目录网站下载.epub文件
有一个网站可以下载.epub文件。我想使用wget抓取我感兴趣的主题。我对wget不太熟悉,并且根据我发现的各种Google搜索将一个脚本拼凑在一起。我的原始脚本可以从相同的文件夹中获取.mp4文件,但没有从相同的文件夹中下载任何.epub文件。我尝试了下面的4个脚本,并从所有脚本中得到了相同的结果。
审判1:
wget -c -r -A.epub -kpN -np -e robots=off "webite" -P D:
1A试用版(看看空间是否重要):
wget -c -r -A .epub -kpN -np -e robots=off "webite" -P D:
审判2:
wget -A.epub --no-clobber --convert-links --random-wait -r -np -p -E -e robots=off -U mozilla "website" -P D:
试验2A(与第一个试验相同):
wget -A .epub --no-clobber --convert-links --random-wait -r -np -p -E -e robots=off -U mozilla "website" -P D:
在所有情况下,我都会收到以下消息:
Reusing existing connection to [thetrove.net]:443.
HTTP request sent,awaiting response...
404 Not Found 2020-09-18 00:38:52 ERROR 404: Not Found.
现在,我过去使用的第一个wget命令没有.epub来从同一网站下载图片和PDF文件,没有404错误消息。如果我将网站更改为不带.epub的其他子文件夹,它将下载其他任何文件,例如图片pdf,mp4或其他内容。如果我在浏览器中访问该网站并尝试手动下载任何返回404错误的文件,则它们下载就很好。我只是不想手动下载我感兴趣的所有子文件夹中的所有文件。
在此先感谢您的帮助。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。