XML在ASP环境下的应用 - 王朝网络宽屏版

XML被誉为未来Web的生命所在。本文介绍如何在服务器端利用新的XML文档对象模型（DOM），通过ASP程序解析和应用XML数据。

一、文档对象模型

在服务器上解析和应用XML的能力为开发者打开了一个全新的世界。随着XML应用的日益广泛，在服务器上处理XML也变得更加重要。本文示范ASP应用在服务器端的XML文档处理过程，使用的XML例子是一个新闻文档。我们将介绍如何编写一个显示新闻文档日期和新闻数量的简单ASP页面，以及如何在ASP页面中显示新闻标题和相应的URL。

文档对象模型即Document Object Model，简称DOM。IE 5.0的XML文档对象模型提供了对W3C DOM核心规范（Level 1）所描述的编程接口的完整支持，同时它还支持一系列XML相关技术，比如XSL、XSL模式匹配、名称空间、数据类型等。DOM是XML解析器所导出的最基本的文档模型，它将XML文档描述为一个很容易导航和使用的树形结构。

W3C的DOM核心规范定义了两组DOM编程接口。第一组接口是编写处理和使用XML文档的应用时所必需的，第二组接口辅助开发者更轻松地处理XML文档。提供第二组接口只是为了方便，对于XML应用来说它们并不是必需的。

在ASP应用中，要在服务器上应用DOM是相当简单的，但服务器上必须安装IE 5.0，这是因为DOM的许多支持组件都是由IE提供的。安装好IE之后，只要在ASP应用中用类似下面的代码就可以创建DOM对象：<% Set objXML = Server.CreateObject("Microsoft.XMLDOM") %>

二、在服务器上处理XML(1)

在服务器上创建了DOM对象之后，我们既可以自己构造新的XML文档，也可以装载一个现有的文档。如果是装载现有文档，还可以选择是读取XML文本字符串，还是打开XML文档并装载其内容。在本文的例子中，我们假定服务器上已经有了一个最近新闻的XML文档mostRecentScriptingNews.xml。在装载XML文档之前，我们应该把DOM对象的async属性设置成“false”，这是告诉DOM对象装载XML文档不是异步进行。这一点非常重要，因为读入XML文档之后我们将立即开始使用它，如果此时文档还没有全部装载完毕，试图访问它就会引发错误。<%Set objXML = Server.CreateObject("Microsoft.XMLDOM")objXML.async = FalseobjXML.Load (Server.MapPath("mostRecentScriptingNews.xml"))%>

下面是我们装载的XML文档mostRecentScriptingNews.xml：<?xml version="1.0" encoding="gb2312" ?><!DOCTYPE scriptingNews SYSTEM"http://www.scripting.com/dtd/scriptingNews.dtd"><scriptingNews><header><copyright>版权所有</copyright><scriptingNewsVersion>1.0</scriptingNewsVersion><pubDate>Wed, 03 Mar 1999 08:00:00 GMT</pubDate><lastBuildDate>Thu, 04 Mar 1999 03:37:03 GMT</lastBuildDate></header><item><text>Linux汽车立体声系统</text><link><url>http://www.wired.com/news/news/technology/story/18236.html</url><linetext>汽车立体声系统</linetext></link></item>...<item>

<text>据News.com,HP将以租用方式提供存储和计算服务。</text><link><url>http://www.news.com/News/Item/0,4,33202,00.html?st.ne.fd.mdh</url><linetext>摘自News.com</linetext></link></item></scriptingNews>

DOM模型的parseError对象包含了最后出现的解析错误信息，这个错误对象对于ASP页面调试和错误控制是很有用的。文档装载完成后，在继续其他操作之前检查parseError对象看看是否存在错误是一种好习惯：<%If objXML.parseError.errorCode <> 0 Then&single; 处理错误End If%>

parseError对象提供了有关错误的丰富而宝贵的信息：

注意在上面的代码中我们以“*”作为getElementsByTagName的参数，此时getElementsByTagName将返回文档中所有元素（或节点）的一个列表。由于我们已经有了DTD，可以直接从DTD获知pubDate的正确位置，但象上例所做的那样通过循环遍历文档也是一种高效的方法，因为节点列表是一个集合。

现在我们得到了新闻的发布日期，下面我们来看看如何计算文档中的新闻数量。从文档的DTD定义我们知道新闻存放在item节点，文档中的每个item节点对应一则新闻。显然，我们可以使用类似上例的另一个循环，在循环内每次遇到item节点就把计数器加1。不过我们还有一种更好的提取该信息的方法，这要用到DOM提供的另外一个方法。

象上例一样，我们所要做的是创建一个包含全部item节点的列表对象，然后通过length属性得到节点列表对象中的节点数量，从而也就得到了文档中新闻的数量：<%Set objLst = objXML.getElementsByTagName("item")strNoOfHeadlines = objLst.Length%>

很多时候我们要在ASP页面中显示来自XML文档的一些信息。下面这个例子显示了如何通过遍历新闻节点列表，在ASP页面中显示新闻及其URL。<%Set objXML = Server.CreateObject("Microsoft.XMLDOM")Set objLst = Server.CreateObject("Microsoft.XMLDOM")Set objHdl = Server.CreateObject("Microsoft.XMLDOM")objXML.async = FalseobjXML.Load (Server.MapPath("mostRecentScriptingNews.xml"))If objXML.parseError.errorCode <> 0 Then&single; 处理错误End IfSet objLst = objXML.getElementsByTagName("item")noOfHeadlines = objLst.length%><HTML><BODY><H1>新闻</H1><%For i = 0 To (noOfHeadlines ?1)Set objHdl = objLst.item(i)Response.Write("<a href=""" & _objHdl.childNodes(1).childNodes(0).text & _""">" & objHdl.childNodes(0).text & _"</a><br>")Next%></BODY></HTML>

结束语：只要对XML文档的结构有一个基本了解，再利用DOM的强大功能，我们就可以方便地在ASP应用服务器端解析XML文档，从解析结果中选择合适的内容发送给客户端。这是一种浏览器无关的方法，适用于几乎所有的Web浏览器。