如何解决如何在后续无头Selenium运行之间保存Instagram登录
Selenium脚本的tl; dr chrome配置文件每次都在非无头模式下工作,但是(有时)在无头模式下失败。
我每隔一小时运行一个Selenium python脚本,要求我登录到Instagram。由于我是在Heroku上进行部署(并且Insta会在检测到异常登录时强制我频繁更改密码),因此我的脚本在运行期间使用无头Chrome浏览器一次登录了insta(从登录屏幕转到insta提要屏幕)第一次运行时,创建一个chrome配置文件,然后为以后的脚本会话运行使用相同的chrome配置文件(带有已保存的cookie等),以免每次都需要登录。如果它检测到我尚未作为后备登录,它还会在以后的运行中重新登录我。
当我使用headless=False
在MacOS上本地运行脚本时,我的脚本始终有效-第一次运行始终正确登录并创建chrome配置文件,该配置文件在下一次运行中可以成功地直接用于我的insta提要。但是,当我使用headless=True
在本地(或在Heroku中)运行该配置文件时,该配置文件有时无法保存我的登录信息(然后我最终需要在下一次运行中重新登录)。
以下是我要传递给网络驱动程序的选项:
from selenium import webdriver
import os
def get_chrome_options(self,headless=True):
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--remote-debugging-port=9222')
if headless:
chrome_options.add_argument('--headless')
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-gpu')
chrome_options.add_argument('--window-size=1200x762')
chrome_options.add_argument('--user-data-dir=' + os.getcwd() + '/chrome_profile_1')
chrome_options.binary_location = os.environ.get("GOOGLE_CHROME_BIN")
return chrome_options
如有必要,我尝试使用user-data-dir
选项创建配置文件(请注意/ chrome_profile_1在第一次运行之前在存储库中不存在),并检索它(如果已经存在)。
我已验证在所有运行中,驱动程序确实会到达insta提要视图,因此我的登录逻辑不是问题。即使在登录信息未正确保存的情况下,脚本仍始终会成功创建chrome_profile目录。我尝试直接将chrome_profile_1推送到我的Heroku实例,但这也不起作用(我不认为Heroku-buildpack-google-chrome与我的本地chrome实例生成的配置文件兼容)。
我还尝试在末尾添加driver.close()
和driver.quit()
,并添加一些额外的时间,以防chrome无头浏览器关闭不当是区别无头和无头运行的原因,但是这似乎无法解决问题。另外,我尝试添加诸如--profile-directory=,'disable-dev-shm-usage',--hide-scrollbars,--single-process,--ignore-certificate-errors
之类的选项。
PS:在相关说明中,Heroku似乎在两次运行之间(https://help.heroku.com/K1PPS2WM/why-are-my-file-uploads-missing-deleted)放弃了已创建的chrome配置文件目录-一旦我弄清楚如何正确创建chrome配置文件,就有办法保存它了在Heroku实例本身上运行之间,还是必须将其存储在外部,然后在下一次运行时将其拉入Heroku?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。