如何解决如何根据标签的属性来解析3.5GB的XML文件?
我想用python解析此XML。我只想查找特定标签的属性。
<managedObject class="XXX" version="XXX18" distName="XXX-RC8/XXX-212404" id="142022">
如果我有上面的标签。我必须仅基于版本,类,distname或id查找所有条目。
当前我正在使用:
etree.XPath("child::Title[contains(text(),'managedObject')]")`
这不适用于当前文件,因为标签具有许多属性。文件内容如下所示。我需要一种优化的解决方案来读取3GB的文件,而不会占用太多RAM。
<managedObject class="XXX" version="XXX18" distName="XXX-RC8/XXX-212404" id="142022">
<list name="Options">
<p>0</p>
<p>1</p>
<p>2</p>
<p>3</p>
<p>6</p>
<p>7</p>
<p>8</p>
<p>9</p>
<p>10</p>
<p>11</p>
<p>12</p>
<p>13</p>
<p>14</p>
<p>15</p>
<p>18</p>
</list>
<p name="SomeOption1">12</p>
<p name="SomeOption2">4</p>
<p name="SomeOption3">2</p>
<p name="SomeOption4">0</p>
<p name="SomeOption1">12</p>
<p name="SomeOption2">4</p>
<p name="SomeOption3">2</p>
<p name="SomeOption4">0</p>
<p name="OtherOption">12</p>
<p name="XOtherOption2">4</p>
<p name="XOtherOption3">2</p>
<p name="XOtherOption4">0</p>
<p name="XXXOtherOption1">12</p>
<p name="XXXOtherOption2">4</p>
<p name="XXXOtherOption3">2</p>
<p name="XXXOtherOption4">0</p>
<p name="YYYYXXXOtherOption1">12</p>
<p name="YYYYXXXOtherOption2">4</p>
<p name="YYYYXXXOtherOption3">2</p>
<p name="YYYYXXXOtherOption4">0</p>
</managedObject>
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。