如何解决如何根据班级名称的开头进行网页抓取?
如何找到所有以特定字符串开头的类名称的元素?
我知道Cheerio可以做$(".item")
之类的事情来获得具有该确切类名的事物。而且我知道您可以执行$("*:contains('hello')")
来获取内容中包含该字符串的所有元素。
但是如何根据部分类名进行过滤?
我的第一个想法是先刮掉所有的“ div”,然后再应用过滤器函数,但这似乎效率不高(还是没有?这是它会做什么吗?)我正在寻找类似{{1 }}
我看着这个问题Extract class name in scrapy,看来您可以使用$("div:classStartsWith('ItemBox_')")
在python中完成它。 javascript和cheerio中的等效功能是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。