如何解决Nokogiri刮板未正确采购
我正在尝试为网页构建刮板以进行数据传输,并遇到了采购问题。
require 'nokogiri'
require 'byebug'
require 'httparty'
require "open-uri"
def scraper
url = "https://page text replaced for privacy"
unparsed_page = HTTParty.get(url,verify: false)
parsed_page = Nokogiri::HTML(unparsed_page,nil,Encoding::UTF_8.to_s)
items = Array.new
products = parsed_page.css("div.product-column > div.row")
products.each do |product|
product = {
byebug
summary: product.css("div.summary> a").value
# image: product.css("div.photo>a.img-responsive").attribute("src").value,byebug
}
items << product
puts "Added #{product[:summary]}"
# puts "Added #{product[:image]}"
end
end
scraper
在byebug
循环的第一行上运行.each
时,出现此错误:
scraper.rb:18: syntax error,unexpected '\n',expecting =>
scraper.rb:21: syntax error,unexpected '}',expecting end
}
scraper.rb:26: syntax error,unexpected end,expecting end-of-input
我认为我正在努力地正确抓住它。有什么想法吗?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。