如何解决使用 Cheerio 从页面中提取数据.. 格式如下我如何动态解析这些表,因为它们可能会有所不同?
我希望聪明的人可以帮助我了解所有这些数组、对象和循环...... DOM 我想抓取什么,然后说导出到 JS 变量作为 JSON 对象。
我在这里要做的就是导出为这种格式的 JSON 字符串。
创建 th : 创建 td 客户端 : 客户端 td 所有者 : 所有者 td
这是从表 ONE 中提取的内容
表二更复杂:
这里可以有无限的 trs ......这是我需要一个循环来确保所有文本内容从 JS 放入 JSON 的地方。
标题 内容 声明: 日期 描述 成本支付余额..... 这里的所有这些行都可以是无限的。 th 和 tds 很清楚,但可以有无限数量的 trs
每个标题都有一个内容(对于内容值,只需加入 div 中的所有值)。 每个标题还有一个可以有多行的语句。它的变量。
所以表格和页面中的列不会改变,但第二个表格和迷你语句的行可以改变。第一个表中的数据是静态的。
我希望可以快速循环将其解析为 JSON 对象,以便我可以发布到我的数据库?
<table class="summary">
<tbody><tr>
<th>Created</th>
<th>Client</th>
<th>Owner</th>
<th>Ref</th>
<th>Email Address</th>
<th>Postal Address</th>
</tr>
<tr>
<td>Created</td>
<td>Client</td>
<td>Owner</td>
<td>Ref</td>
<td>Email</td>
<td>Postal Address</td>
</tr>
</tbody></table>
<hr>
<table>
<tbody><tr>
<th>Title</th>
<th>Content</th>
<th>Statement</th>
</tr>
<tr>
<td>
<div>
<a class="packageTitle" onclick="openPackageDetail("")" title="Click for detail">{TITLE}</a>
</div>
</td>
<td>
<div>
<div>
{CONTENT1}
</div>
<div class="lighter smaller">Containing:</div>
<div>
<div class="smaller">
Early Bird Guest (1)
</div>
</div>
</div>
</td>
<td>
<table class="smaller statement">
<tbody><tr>
<th>Date</th>
<th>Description</th>
<th style="padding-right:1em">Cost</th>
<th style="padding-right:1em">Payment</th>
<th>Balance</th>
</tr>
<tr>
<td>dATE AND TIME</td>
<td>DESCRIPTION</td>
<td>COST</td>
<td>PAYMENT</td>
<td>BALANCE</td>
</tr>
<tr>
<td>DATE</td>
<td>DESCRIPTION</td>
<td>COST</td>
<td>PAYMENT</td>
<td>BALANCE</td>
</tr>
</tbody></table>
</td>
</tr>
</tbody></table>
</div>
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。