Xpath文件表达式

简单说,xpath就是选择XML文件中节点的方法。

所谓节点(node),就是XML文件的最小构成单位,一共分成7种。

-element(元素节点)
-attribute(属性节点)
-text(文本节点)
-namespace(名称空间节点)
-processing-instruction(处理命令节点)
-comment(注释节点)
-root(根节点)

xpath可以用来选择这7种节点。不过,下面的笔记只涉及最常用的第一种element(元素节点),因此可以将下文中的节点和元素视为同义词。


一、xpath表达式的基本格式

xpath通过“路径表达式”(PathExpression)来选择节点。在形式上,“路径表达式”与传统的文件系统非常类似。

#斜杠(/)作为路径内部的分割符。

#同一个节点有绝对路径和相对路径两种写法。

#绝对路径(absolutepath)必须用“/”起首,后面紧跟根节点,比如/step/step/...。

#相对路径(relativepath)则是除了绝对路径以外的其他写法,比如step/step,也就是不使用“/”起首。

#“.”表示当前节点。

#“..”表示当前节点的父节点


二、选择节点的基本规则

-nodename(节点名称):表示选择该节点的所有子节点

-“/”:表示选择根节点

-“//”:表示选择任意位置的某个节点

-“@”:表示选择某个属性


三、选择节点的实例

先看一个XML实例文档。

<?xmlversion="1.0"encoding="ISO-8859-1"?>

<bookstore>

<book>
<titlelang="eng">HarryPotter</title><price>29.99</price></book>

<titlelang="eng">LearningXML</title><price>39.95</price></book>

</bookstore>

[例1]

bookstore:选取bookstore元素的所有子节点。

[例2]

/bookstore:选取根节点bookstore,这是绝对路径写法。

[例3]

bookstore/book:选取所有属于bookstore的子元素的book元素,这是相对路径写法。

[例4]

//book:选择所有book子元素,而不管它们在文档中的位置。

[例5]

bookstore//book:选择所有属于bookstore元素的后代的book元素,而不管它们位于bookstore之下的什么位置。

[例6]

//@lang:选取所有名为lang的属性。


四、xpath的谓语条件(Predicate)

所谓“谓语条件”,就是对路径表达式的附加条件。

所有的条件,都写在方括号“[]”中,表示对节点进行进一步的筛选。

[例7]

/bookstore/book[1]:表示选择bookstore的第一个book子元素。

[例8]

/bookstore/book[last()]:表示选择bookstore的最后一个book子元素。

[例9]

/bookstore/book[last()-1]:表示选择bookstore的倒数第二个book子元素。

[例10]

/bookstore/book[position()<3]:表示选择bookstore的前两个book子元素。

[例11]

//title[@lang]:表示选择所有具有lang属性的title节点。

[例12]

//title[@lang='eng']:表示选择所有lang属性的值等于“eng”的title节点。

[例13]

/bookstore/book[price]:表示选择bookstore的book子元素,且被选中的book元素必须带有price子元素。

[例14]

/bookstore/book[price>35.00]:表示选择bookstore的book子元素,且被选中的book元素的price子元素值必须大于35。

[例15]

/bookstore/book[price>35.00]/title:表示在例14结果集中,选择title子元素。

[例16]

/bookstore/book/price[.>35.00]:表示选择值大于35的“/bookstore/book”的price子元素。


五、通配符

#“*”表示匹配任何元素节点。

#“@*”表示匹配任何属性值。

#node()表示匹配任何类型的节点。

[例17]

//*:选择文档中的所有元素节点。

[例18]

/*/*:表示选择所有第二层的元素节点。

[例19]

/bookstore/*:表示选择bookstore的所有元素子节点。

[例20]

//title[@*]:表示选择所有带有属性的title元素。


六、选择多个路径

用“|”选择多个并列的路径。

[例21]

//book/title|//book/price:表示同时选择book元素的title子元素和price子元素。


七、选择不符合条件的路径

用“not(@属性)”选择不包含某个属性的节点

用“not(@属性or@属性)”选择不包含多个属性的节点

[例22]

//tbody/tr[not(@class)]:排除一个属性的节点可以使用来写

//tbody/tr[not(@classor@id)]:排除一个或者两个属性可以使用

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念
xml文件介绍及使用
xml编程(一)-xml语法
XML文件结构和基本语法
第2章 包装类
XML入门的常见问题(二)
Java对象的强、软、弱和虚引用
JS解析XML文件和XML字符串详解
java中枚举的详细使用介绍
了解Xml格式
XML入门的常见问题(四)
深入SQLite多线程的使用总结详解
PlayFramework完整实现一个APP(一)
XML和YAML的使用方法
XML轻松学习总节篇