如何解决来自lxml的意外htmlelement结果
我的代码:
from lxml import html
import request
currentPage = requests.get('https://www.bbc.co.uk/programmes/m000lyx0')
currentTree = html.fromstring(currentPage.content)
currentTree = html.parse("./index.html")
beilagen = currentTree.xpath('//div[@class="segment__track"]')
for x in beilagen:
artist = x.xpath('//span[@class="artist"]/text()')
f.close()
我正在尝试从html中提取艺术家和歌曲。变量beilagen
是所有曲目的列表。在for循环中,我尝试获取每个单独的曲目,但是变量 artist 容纳所有艺术家,我的期望是仅容纳一个艺术家。为什么我得到所有艺术家?除了x
"<Element div at 0x10db2bad0>"
变量的详细内容
非常感谢
html:https://www.bbc.co.uk/programmes/m000lyx0
解决方法
尝试从以下位置更改for
循环
artist = x.xpath('//span[@class="artist"]/text()')
到
artist = x.xpath('.//span[@class="artist"]/text()')
看看是否可行。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。