如何解决Python:Xpath无法找到元素
我正在尝试从网站上获取一些数据,但出现错误。它昨晚工作了,但是当我今天重新运行时,突然找不到元素。今天,我几乎可以尝试,但无法解决。
工具和语言-Python,Selenium,Chrome,Chromedriver,AWS Cloud 9,EC2
from selenium import webdriver
import time
from selenium.webdriver.chrome.options import Options
options = Options()
options.headless = True
driver = webdriver.Chrome(options=options)
driver.get('https://www.espncricinfo.com/series/19496/scorecard/1198235/england-vs-australia-1st-t20i-england-v-australia-2020')
time.sleep(20)
element_text = driver.find_element_by_xpath('//*[@id="main-container"]/div/div[2]/div[2]/div/div[1]/div[1]/div[1]/div[1]/div[1]/div[2]').text
print(element_text)
错误消息
selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"xpath","selector":"//*[@id="main-container"]/div/div[2]/div[2]/div/div[1]/div[1]/div[1]/div[1]/div[1]/div[2]"}
我尝试了以下事情
- 添加和删除了睡眠时间。增加和减少睡眠时间
- 使用完整的Xpath,Xpath,按类查找
- 试图找到不同的元素。
- 不同页面
所引用的各个站点仍然无法解析。我是python的新手。
解决方法
尝试一下:
import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
options = Options()
options.headless = True
driver = webdriver.Chrome(options=options)
url = 'https://www.espncricinfo.com/series/19496' \
'/scorecard/1198235/england-vs-australia-1st-t20i-england-v-australia-2020'
driver.get(url)
time.sleep(2)
element = driver.find_element_by_xpath('//div[@class="desc text-truncate"]')
print(element.text)
输出:
1st T20I (N),Southampton,Sep 4 2020,Australia tour of England
,
要打印文本 2020年9月4日,南安普敦1st T20I(N),澳大利亚英格兰之旅,您可以使用以下任一Locator Strategies:
-
使用
class_name
和 text 属性:print(driver.find_element_by_class_name("desc").text)
-
使用
css_selector
和get_attribute()
:print(driver.find_element_by_css_selector("div.desc").get_attribute("innerHTML"))
-
使用
xpath
和 text 属性:print(driver.find_element_by_xpath("//div[@class='desc text-truncate']").text)
理想情况下,要打印元素的innerText
,您必须为visibility_of_element_located()
引入WebDriverWait,并且可以使用以下Locator Strategies之一:
-
使用
CLASS_NAME
:print(WebDriverWait(driver,20).until(EC.visibility_of_element_located((By.CLASS_NAME,"desc"))).text)
-
使用
CSS_SELECTOR
:print(WebDriverWait(driver,20).until(EC.visibility_of_element_located((By.CSS_SELECTOR,"div.desc"))).get_attribute("innerHTML"))
-
使用
XPATH
:print(WebDriverWait(driver,20).until(EC.visibility_of_element_located((By.XPATH,"//div[@class='desc text-truncate']"))).text)
-
注意:您必须添加以下导入:
from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC
您可以在How to retrieve the text of a WebElement using Selenium - Python
中找到相关的讨论
Outro
链接到有用的文档:
-
get_attribute()
方法Gets the given attribute or property of the element.
-
text
属性返回The text of the element.
- Difference between text and innerHTML using Selenium
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。