它提供了一个非常方便的API来提取和操作数据,使用最好的DOM,CSS和类似jquery的方法。
jsoup 实现了 WHATWG HTML5 规范,并将 HTML 解析为与现代浏览器相同的 DOM。
- 从URL,文件或字符串中刮取和解析HTML
- 使用DOM遍历或CSS选择器查找和提取数据
- 操纵HTML元素,属性和文本
- 清除用户提交的内容与安全的白名单,以防止XSS攻击
- 输出整齐的HTML
jsoup 有一个不足之处就是不支持JS。
原文地址:https://blog.csdn.net/testcs_dn/article/details/78791785
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。