如何解决如何使用基于标签的XML :: Twig解析器在Unix上清理xml文件
我需要清除不必要的信息(重复,过时等)中的XML文件。 我有带有不同命名标签的XML文件,但是它们都具有相似的属性,我正在寻找一种解决方案,该方法是通过将参数传递给Perl解析器从XML文件中剪切掉一些标签。
示例XML结构为:
<Jobs>
<Job>
<JobID>ID1</JobID>
<DueDate>01-02-2008</DueDate>
</Job>
<Job>
<JobID>ID2</JobID>
<DueDate>01-02-2009</DueDate>
</Job>
<Job>
<JobID>ID3</JobID>
<DueDate>01-02-2010</DueDate>
</Job>
<Job>
<JobID>ID4</JobID>
<DueDate>01-02-2011</DueDate>
</Job>
<Job>
<JobID>ID5</JobID>
<DueDate>01-02-2012</DueDate>
</Job>
</Jobs>
现在假设我想剪切Job
标签,该标签包含文本JobID
的{{1}}标签,而我的output.xml文件将变为:
ID3
请帮助我使用<Jobs>
<Job>
<JobID>ID1</JobID>
<DueDate>01-02-2008</DueDate>
</Job>
<Job>
<JobID>ID2</JobID>
<DueDate>01-02-2009</DueDate>
</Job>
<Job>
<JobID>ID4</JobID>
<DueDate>01-02-2011</DueDate>
</Job>
<Job>
<JobID>ID5</JobID>
<DueDate>01-02-2012</DueDate>
</Job>
</Jobs>
编写代码,这可以帮助使用Perl Based on suggestion made here
我需要在文件中的任何位置剪切标签,并拉出其下的所有其他标签,然后保存回文件(最好保存到同一文件)。
我需要有一个Perl脚本并像这样将参数传递给它:
有两个参数传递给脚本:
- 必须删除的标签名称,将其命名为
XML::Twig
- 嵌套在R_tag下的标签名称,我们称其为
R_tag
- 我们必须传递一个值,该值的嵌套标记必须等于此值才能触发
R_tag_nested
的移除,在我们的情况下为R_tag
我将使用此行调用脚本
ID3
但是同时我希望足够灵活,以便通过发送多个嵌套标签参数(因为myscript.pl?R_tag&R_tag_nested=ID3
在整个文档中都是相同的)来一次性剪切2个或更多标签,并且命令将是:
R_tag
会将这样的输出提供给output.xml文件:
myscript.pl?R_tag&R_tag_nested=ID3&R_tag_nested=ID5
我还没有开始编写它,因为我对使用XML :: Twig进行XML的剪切/粘贴/修剪没有太多的经验,因此需要从头开始编写这段简短代码的帮助。
解决方法
您尚未确定是什么使您遇到问题,所以我假设您正在询问如何解决该问题。
当您要从列表中移出过滤出的项目时,散列很有用。构建以下哈希:
my %to_remove = (
"ID3" => 1,"ID5" => 1,);
然后,这只是遍历您可能想要删除的节点,获取其文本内容并删除那些节点的问题 满足以下条件:
$to_remove{$text_content}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。