如何解决如何只抓取文字?
代码:
import scrapy
class BlogSpider(scrapy.Spider):
name = 'bijouterie'
start_urls = ['https://www.example.com']
def parse(self,response):
for post in response.css('#engine-results .drs'):
yield {'title': post.css('a.moodalbox.response').get()}
运行命令(Windows 10):
scrapy runspider C:\Users\DELL\Desktop\icscrap\bijouterie.py -o posts.csv
CSV文件:https://pastebin.com/qEQTKEcC
我只想抓取文本而不是整个html类代码。
解决方法
只需在CSS选择器的末尾添加(:: text),例如
curl -s -v -X POST --data '{
"zoneConfig": {
"userID": "'$userid'","name": "'$myName'","id":"'$id'"
},"delete": [
{
"id": "ID1"
},{
"id": "ID2"
}
]
}' https://urlToAPI
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。