如何解决XPath Wordpress Scraper插件
我正在尝试使用XPath或Regex分别刮擦城市和州。我可以选择城市和州,并用逗号分隔,例如
卑诗省小路(page link)
通过Xpath:
//div[contains(text(),",")])[1]
/div[1]/div[1]/div[3]/div/div/div[1]/div[1]/div[3]/div[2]/div/div/div/div[4]
或正则表达式:
([A-z]+)(,\s)(AB|BC|ON)
但是,当我尝试使用substring-before和after来抓取City或Province时,例如:
Xpath 2.0 //div[contains(text(),")])[1]/substring-after(text(),")
或Xpath 1.0 substring-after(//div[contains(text(),")])[1],")
plugin仅能返回城市。语法有什么问题吗?
解决方法
使用相对的XPath表达式。
//span[@data-indeed-apply-joblocation]/@data-indeed-apply-joblocation
输出:Trail,BC
substring-before(//span[@data-indeed-apply-joblocation]/@data-indeed-apply-joblocation,",")
输出:Trail
substring-after(//span[@data-indeed-apply-joblocation]/@data-indeed-apply-joblocation,")
输出:BC
EDIT :由于不支持子字符串功能,请使用正则表达式清除结果。保留我提供的XPath(将右侧面板中的“部件”设置为“文本内容”)。然后,在“变形”菜单(右侧面板中的“高级模式”)的“查找和替换”下,输入以下正则表达式:
^.+,\W
一无所有。
输出:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。