当前,Java 2平台企业版(J2EE)架构在厂商市场和开发者社区中倍受推崇。作为一种工具,可扩展标记语言(XML)简化了数据交换、进程间消息交换这一类的事情,因而对开发者逐渐变得有吸引力,并开始流行起来。自然,在J2EE架构中访问或集成XML解决方案的想法也很诱人。因为这将是强大系统架构同高度灵活的数据治理方案的结合。
XML的应用似乎是无穷无尽的,但它们大致上可以分为三大类:
●简单数据的表示和交换(针对XML的简单API(SAX)和文档对象模型(DOM)语法解析,不同的文档类型定义(DTDs)和概要(schemas))
●面向消息的计算(XML-RPC(远程过程调用),SOAP协议,电子化业务XML(ebXML))
●用户界面相关、表示相关的上下文(可扩展样式表语言(XSL),可扩展样式表语言转换(XSLT))
这几类应用在J2EE架构中恰好有天然的对应:数据表示和交换功能是EJB组件模型中持久化服务(persistence services)的一部分,基于消息的通讯由Java消息服务(JMS)API来处理,而界面表示正是Java服务器页面(jsp)和Java Servlets的拿手好戏。
在本文中,我们将看到当今基于J2EE的应用里,XML是如何在上述几个方面进行应用的,以及在相关标准的未来版本中这些应用将会如何发展。
基础:数据的表示和交换
原型化的XML应用(假设有的话)的内容通常是:数据以XML格式存放,为了进行显示、修改甚至写入某个XML文档而经常被读入到某个对象模型中。作为例子,假定我们正处理多种类型的媒体(图品、视频、文本文档等等),并且用下面这个简单的XML DTD来描述这些媒体的元数据:
<!-- DTD for a hypothetical media management system -->
<!-- Media assets are the root of the object hierarchy. Assets are also
hierarchical - they can contain other assets. -->
<!ELEMENT media-asset (name, desc?, type*, media-asset*, urn)>
<!-- Metadata about the asset -->
<!ELEMENT name (#PCDATA)>
<!ELEMENT desc (#PCDATA)>
<!ELEMENT type (desc, mime-type?)>
<!ELEMENT mime-type (#PCDATA)>
<!ELEMENT urn (#PCDATA)>
以下是一个基于上述媒体DTD的XML文档,描述了与某个课程讲座相关的内容:
<?xml version="1.0" ?><!DOCTYPE media-asset PUBLIC "-//Jim Farley//DTD
Media Assets//EN" "http://localhost/Articles/Sun/dtds/media.dtd">
<media-asset>
<name>第14讲</name>
<desc>与第14讲相关的所有内容</desc>
<!-- 内容对象"lecture 14"的一套子组件 -->
<media-asset>
<name>讲座的幻灯片</name>
<type>
<desc>MS Powerpoint</desc>
<mime-type>application/vnd.ms-powerpoint</mime-type>
</type>
<urn>http://javatraining.org/jaf/E123/lecture-
14/slides.ppt</urn>
</media-asset>
<media-asset>
<name>讲座的视频片断</name>
<type>
<desc>RealPlayer streaming video</desc>
<mime-type>video/vnd.rn-realvideo</mime-type>
</type>
<urn>http://javatraining.org/jaf/E123/lecture-
14/lecture.rv</urn>
</media-asset>
<!-- 讲座开始 -->
<urn>http://javatraining.org/jaf/E123/lecture-14/index.jsp</urn>
</media-asset>
从Web或者企业级应用的角度看,能以这种方式访问数据真是一种福音,因为它体现了高度的可移动性,使我们与元数据的实际资源本身隔离。这些资源可能来自一个关系数据库系统、某种活动媒体服务器或者Web服务器上的一个静态XML文档,等等。假如想把这些数据加载到Java应用中,我们可以从当前众多的Java语言XML解析器中选用一个,通过它将XML数据装入一个DOM文档,最后遍历文档,将所有这些数据转换到我们应用系统的对象模型中。
下面是个简单的基于DOM的解析程序,可对上述的媒体DTD进行解析。解析器用的是Apache Xerces:
package jaf.xml;
import java.util.*;
import java.io.IOException;
import org.w3c.dom.*;
import org.xml.sax.*;
// XML文档解析程序,使用上述媒体DTD.
public class MediaParser implements ErrorHandler {
/** 使用Apache Xerces解析器 */
org.apache.xerces.parsers.DOMParser mParser =
new org.apache.xerces.parsers.DOMParser();
/** 构造函数 */
public MediaParser() {
// 告诉解析器验证并解析文档
try {
mParser.setFeature( "http://xml.org/sax/features/validation",
true);
}
catch (SAXException e) {
System.out.println("Error setting validation on parser:");
e.printStackTrace();
}
// 设置解析器的错误处理句柄
mParser.setErrorHandler(this);
}
/** 解析指定的URL,返回找到的XML文档
*/
public Document parse(String url) throws SAXException, IOException {
mParser.parse(url);
Document mediaDoc = mParser.getDocument();
return mediaDoc;
}
/** 解析指定URL的XML文档,将内容转换成 MediaAsset 对象
*/
public Collection loadAssets(String url) throws SAXException,
IOException {
Document doc = parse(url);
Collection assets = new LinkedList();
NodeList assetNodes = doc.getElementsByTagName("media-asset");
for (int i = 0; i < assetNodes.getLength(); i++) {
Node assetNode = assetNodes.item(i);
MediaAsset asset = new MediaAsset(assetNode);
assets.add(asset);
}
return assets;
}
/**
* 错误处理代码(为简洁起见省略了)
*/
}
MediaParser类的构造函数初始化了一个Xerces DOM解析器。parse()方法告诉解析器到哪个URL去找XML源,然后得到结果文档并返回。loadAssets()方法调用parse()方法从某个XML源加载文档,然后为文档中找到的每个“media-asset”节点创建一个MediaAsset对象。
以下是一个使用MediaAsset类的例子:
package jaf.xml;
import java.util.*;
public class MediaAsset {
// 资源元数据
private String mName = "";
private String mDesc = "";
private Collection mChildren = new LinkedList();
private Vector mTypes = new Vector();
private String mUrn = "";
protected MediaAsset(org.w3c.dom.Node assetNode) {
// 为简洁起见省略后面代码
.
.
.
}
}
因为篇幅的关系省略了MediaAsset类的具体代码,但应用模式依然是清楚的。MediaAsset类遍历文档的节点,当它碰到不同的子节点时,它用子节点的内容填充自己的成员数据。假如它发现了一个嵌套的子资源节点,它只需要创建一个新的MediaAsset对象,然后将子资源节点的数据填充到新对象的成员数据中。
实现上述处理的方法数不胜数。我们还可以使用其他的解析器或解析器架构,如Java API for XML Parsing (JAXP)。除了使用DOM模型外,事件驱动的SAX模型也可用于解析XML。类似的程序也可用来产生XML数据——前提是答应产生新的数据对象(在本例中是MediaAsset),它可将其相应的XML实体插入到DOM中,然后将DOM输出到一个流中(诸如一个文件,一个Socket,或者一个HTTP连接...)。还有其他更高层次的标准,可将XML映射到Java对象的过程进一步自动化(或简化)。例如,使用XML概要(Schema)和XML绑定处理引擎,您可以半自动地将满足某个XML 概要的XML数据转变成Java数据对象。代表性的引擎是Castor,是由ExoLab小组治理的一个开放源代码项目的产物。上述使用Xerces DOM的简单例子仅仅是演示了这一处理过程的底层模型。
上述示例表明,在Java环境中解析或产生XML是非常方便的,这与J2EE没有必然关联。格式化为XML的数据可以从应用程序的任何层次流入或输出,这使得与外部系统的集成性无可限量。但我们能否以一种更为直接的方式将XML数据源集成到J2EE架构中去呢?
驾驭消息
J2EE架构包含了对JMS(Java消息服务)API的访问,以实现面向消息的通信(J2EE 1.2.1版只需JMS API即可,在J2EE 1.3版中JMS基本定型,此时必须由某个兼容J2EE平台的服务器提供一个JMS API Provider)。这一类的异步交互(与之相对的是:本地或远程方法调用所代表的同步交互)被证实在某些应用环境中是非常有用的。某些时候,交互只需要通过间接的请求或回答来实现,即:在某些情况下,发出消息后不可能立即收到答复,但我们仍希望当消息发出者重新在线时,确保他能收到答复信息。
面向消息系统的实际应用之一就是企业之间的松散集成。类似于EDI(电子文档交换)时代的文档交换,两个企业由于业务的需要而交换消息,此时通常不能为了使用RPC或者RMI、CORBA、DCOM之类的远程方法交互而在两者之间进行紧密集成。象JMS API这样的消息系统答应双方交换基于JMS API的消息载荷,前提是双方在会话的时候均能提供兼容的JMS API服务。当前仍然存在的困难是