如何解决手动登录,因为之后会进行reCaptcha进行网络抓取
我想用reCaptcha保护的登录表单后面的整个网站(用AngularJS编写)。刮板应从http://sub.example.com/contents/pt/table-of-contents开始,保存页面,然后一次又一次地浏览内容中的所有链接。但是当我们未经身份验证时,网站会将我们重定向到https://example.com/user/login?url=http://sub.example.com/,以便首先登录。
我在IDM(Internet下载管理器)中使用了“站点抓取器”,但是它太老了,无法带我通过。它显示脚本错误,因为它无法加载jQuery。
我还品尝了PhantomJS,SlimerJS和HTTrack,但似乎他们无法显示登录表单,等待我手动解决验证码。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。