如何解决如何自动更新 cookie
我的母语不是英语,如果我说的话让你感到困惑,我很抱歉。谢谢。
我最近在一个网站上爬东西,正常的操作步骤应该如下:
- 我登录了这个网站
- 我跳转到子页面
- 我点击了一个按钮(实际上它执行了一个 JS 函数)
- 网站返回了一些东西
但这很不方便,因为我总是需要打开浏览器才能完成这些步骤。于是在F12中找到step3的XHR,复制到curl命令中循环。 这比以前简单多了,但我还是需要用浏览器登录并复制最新的cookie来更新我的curl命令。
假设 Step1 和 Step3 实际上是 XHR,我知道 args 是什么意思。 我的问题是,如何在不使用浏览器的情况下获取最新的 cookie,我的意思是,一个真正的浏览器软件(我认为这是唯一需要解决的问题)?或者还有什么我不知道需要做的事情吗?
解决方法
典型的登录由发送到服务器的 post-request
组成。负载通常包含纯文本形式的用户名和密码,就像从 html-form
发送的一样。然后,来自服务器的答案在其标头中包含会话 cookie(有时称为 PHPSESSID
或类似名称)。
然后可以使用会话 cookie 发出进一步的请求。
有时 session-cookie 在您登录之前已经设置,但只有在登录时才会激活。通常您每次连接时都会获得一个新的 session-cookie。
有些网站部署了诸如 google-nocaptcha-recaptcha
之类的技术,完全阻止机器人登录,正如您所知。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。