如何解决正则表达式与bs4拆分结果
我的正则表达式正在产生分割结果,因此我必须下标以便快速修复。
代码
my_url = 'https://www.zoopla.co.uk/for-sale/property/b23/?page_size=100&q=B23&radius=0&results_sort=newest_listings&search_source=refine'
house_listings = page_soup.findAll("div",{"class":"listing-results-right clearfix"})
listings = house_listings[3] # item 3 for prototyping
house_type = re.findall('(?:(?!.for).)*',str(listings.h2.a.text))
print(house_type)
# `['4 bed detached house','','for sale','']`
修复
house_type = re.findall('(?:(?!.for).)*',str(listings.h2.a.text))[0]
print(house_type)
# 4 bed detached house
但是除此之外,我还需要一个新的正则表达式以更好地匹配。
所需匹配项
从“床”之后的单词开始(减去以下空格),然后忽略“待售”部分。
例如结果:detached house
,terrace house
,semi-detached house
,flat
,maisonette
。
解决方法
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。