XPath

XPath

XML路径语言
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快地被开发者采用来当作小型查询语言。
  • 中文名:可扩展标记语言路径语言
  • 外文名:Xml Path Language
  • 别名:
  • 简 称:XPath
  • 释 义:确定XML文档中某部分位置的语言
  • 基 于:XML的树状结构
  • 用 途:查询语言

语法

选取节点XPath使用路径表达式在XML文档中选取节点。节点是通过沿着路径或者step来选取的。

下面列出了最有用的路径表达式:

表达式

描述

nodename

选取此节点的所有子节点。

/

从根节点选取。

//

从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。

.

选取当前节点。

..

选取当前节点的父节点。

@

选取属性。

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

路径表达式

结果

bookstore

选取bookstore元素的所有子节点。

/bookstore

选取根元素bookstore。

注释:假如路径起始于正斜杠(/),则此路径始终代表到某元素的绝对路径!

bookstore/book

选取属于bookstore的子元素的所有book元素。

//book

选取所有book子元素,而不管它们在文档中的位置。

bookstore//book

选择属于bookstore元素的后代的所有book元素,而不管它们位于bookstore之下的什么位置。

//@lang

选取名为lang的所有属性。

表达式

XPath使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。路径表达式是从一个XML节点(当前的上下文节点)到另一个节点、或一组节点的书面步骤顺序。这些步骤以“/”字符分开,每一步有三个构成成分:

1、轴描述(用最直接的方式接近目标节点)

2、节点测试(用于筛选节点位置和名称)

3、节点描述(用于筛选节点的属性和子节点特征)

一般情况下,我们使用简写后的语法。虽然完整的轴描述是一种更加贴近人类语言,利用自然语言的单词和语法来书写的描述方式,但是相比之下也更加啰嗦。

运算符

下面列出了可用在XPath表达式中的运算符:

运算符

描述

实例

返回值

|

计算两个节点集

//book|//cd

返回所有拥有book和cd元素的节点集

+

加法

6+4

10

-

减法

6-4

2

*

乘法

6*4

24

div

除法

8div4

2

=

等于

price=9.80

如果price是9.80,则返回true。

如果price是9.90,则返回false。

!=

不等于

price!=9.80

如果price是9.90,则返回true。

如果price是9.80,则返回false。

<

小于

price<9.80

如果price是9.00,则返回true。

如果price是9.90,则返回false。

<=

小于或等于

price<=9.80

如果price是9.00,则返回true。

如果price是9.90,则返回false。

>

大于

price>9.80

如果price是9.90,则返回true。

如果price是9.80,则返回false。

>=

大于或等于

price>=9.80

如果price是9.90,则返回true。

如果price是9.70,则返回false。

or

price=9.80orprice=9.70

如果price是9.80,

或者price是9.70,则返回true。

and

price>9.00andprice<9.90

如果price大于9.00,

并且price小于9.90,则返回true。

mod

计算除法的余数

5mod2

1

标准函数

XPath含有超过100个内建的函数。这些函数用于字符串值、数值,日期和时间比较、节点和QName处理、序列处理、逻辑值等等。

使用

XPath是XSLT标准中的主要元素。如果没有XPath方面的知识,您就无法创建XSLT文档。

XQuery和XPointer均构建于XPath表达式之上。XQuery1.0和XPath2.0共享相同的数据模型,并支持相同的函数和运算符。

您可以在我们的《XQuery教程》中阅读更多有关XQuery的知识。

标准

XPath于1999年11月16日成为W3C标准。

XPath被设计供XSLT、XPointer以及其他XML解析软件使用。

轴定义

轴可定义相对于当前节点的节点集。

轴名称

结果

ancestor

选取当前节点的所有先辈(父、祖父等)。

ancestor-or-self

选取当前节点的所有先辈(父、祖父等)以及当前节点本身。

attribute

选取当前节点的所有属性。

child

选取当前节点的所有子元素。

descendant

选取当前节点的所有后代元素(子、孙等)。

descendant-or-self

选取当前节点的所有后代元素(子、孙等)以及当前节点本身。

following

选取文档中当前节点的结束标签之后的所有节点。

namespace

选取当前节点的所有命名空间节点。

parent

选取当前节点的父节点。

preceding

选取文档中当前节点的开始标签之前的所有节点。

preceding-sibling

选取当前节点之前的所有同级节点。

self

选取当前节点。

每个步均根据当前节点集之中的节点来进行计算。

步(step)包括:

轴(axis)

定义所选节点与当前节点之间的树关系

节点测试(node-test)

识别某个轴内部的节点

零个或者更多谓语(predicate)

更深入地提炼所选的节点集

步的语法:

轴名称::节点测试[谓语]

实例

例子

结果

child::book

选取所有属于当前节点的子元素的book节点。

attribute::lang

选取当前节点的lang属性。

child::*

选取当前节点的所有子元素。

attribute::*

选取当前节点的所有属性。

child::text()

选取当前节点的所有文本子节点。

child::node()

选取当前节点的所有子节点。

descendant::book

选取当前节点的所有book后代。

ancestor::book

选择当前节点的所有book先辈。

ancestor-or-self::book

选取当前节点的所有book先辈以及当前节点(如果此节点是book节点)

child::*/child::price

选取当前节点的所有price孙节点。

节点关系

节点(Node)是XPath的术语。

在XPath中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档(根)节点。XML文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。

存取函数

名称、说明

fn:node-name(node)返回参数节点的节点名称。

fn:nilled(node)返回是否拒绝参数节点的布尔值。

fn:data(item.item,...)接受项目序列,并返回原子值序列。

fn:base-uri()

fn:base-uri(node)

返回当前节点或指定节点的base-uri属性的值。

fn:document-uri(node)返回指定节点的document-uri属性的值。

语言升级

在W3C建议下,XPath1.0于1999年11月16日发表。XPath2.0正在W3C审核过程的最终阶段。XPath2.0表达了XPath语言在大小与能力上显著的增加。

最值得一提的改变是XPath2.0有了更丰富的型别系统;XPath2.0支持不可分割型态,如在XMLS chema内建型态定义一样,并且也可自纲要(schema)导入用户自定型别。每个值都是一个序列(一个单一不可分割值或节点都被视为长度一的序列)。XPath1.0节点组被节点序列取代,它可以是任何顺序。

为了支持更丰富的型别组,XPath2.0提供相当延展的函式与操作子群。

XPath2.0实际上是XQuery1.0的子集合。它提供了一个for表达式。该式是XQuery里“FLWOR”表达式的缩减版。利用列出XQuery省去的部分来描述该语言是可能的。主要范例是查询前导语(query prolog)、元素和属性建构式、“FLWOR”语法的余项式、以及typeswitch表达式。

相关词条

相关搜索

其它词条