1. XML-QL查询介绍及其常用部分语法结构
面对庞大的XML数据量,有几个重要问题需要解决。例如,利用什么技术或工具可以从大型XML文档中抽取数据;可以在不同的DTD之间翻译XML数据;可以从多个XML文档中结合数据;或者可以传送大量的XML数据。
数据抽取、传送、合并是传统的数据库问题,这些问题的解决得益于结构化查询语言SQL的实现。但是SQL不能直接运用到XML中,因为XML中的数据结构不仅包含传统的结构化数据格式,而且还包含大量的半结构化数据。而XML-QL的出现就解决了这些问题。
XML-QL语言能够通过查询来从XML文档中抽取信息,能够在不同DTD之间翻译XML数据,能够从多个XML文档中结合数据,能够传送XML数据等。
目前由W3C组织提出的XML-QL查询语言是查询XML文档的标准语言,另外还存在一些由其他组织自主研发的XML查询语言,例如AT&T公司的STRU-QL。以下论述是以W3C提出的标准QL为基准。以lib.xml作为输入的完整xml文档,介绍XML-QL的五种语法结构。文档lib.xml内容如下:
<?Xml version=”1.0?>
<lib>
<book year=”2000”>
<title>数据库系统概论</title>
<author><lastname>萨师煊</lastname></author>
<author><lastname>王珊</lastname></author>
<publisher><name>高等教育出版社</name></publisher>
</book>
<book year=”2001”>
<title>C程序设计第二版</title>
<author><lastname>谭浩强</lastname></author>
<publisher><name>清华大学出版社</name></publisher>
<book>
</lib>
(1)用模式匹配数据
XML-QL使用元素模式来查找XML文档中的数据。如果在lib.xml中查询所有清华大学出版社编书的作者,可使用以下查询:
WHERE <book>
<publisher><name>清华大学出版社</name></publisher>
<author>$a</author>
</book> IN”lib.xml”
CONSTRUCT $a
在以上的查找中,匹配的<book>元素必须包含一个<author>元素,而且有一个<name>元素为“清华大学出版社”的<publisher>元素。每找到一个符合条件的<book>元素,该XML-QL就会把<author>元素的内容赋给变量a。而XML-QL的最后结果是所有赋给a的<author>元素的内容。
(2)建立XML数据
上述查询中,XML-QL会生成一系列的<author>元素,也可以生成一系列包含<author>元素和<title>元素的<result>元素,以查找“高等教育出版社”的作者为例。
WHERE <book>
<publisher><name>高等教育出版社</name></publisher>
<title>$t</title>
<author>$a</author>
</book> IN”lib.xml”
CONSTRUCT <result>
<author>$a</author>
<title>$t</title>
</result>
应用查询后我们将得到以下结果:
<result>
<author><lastname>萨师煊</lastname></author>
<title>数据库系统概论</title>
</result>
<result>
<author><lastname>王珊</lastname></author>
<title>数据库系统概论</title>
</result>