使用DOM解析并打印XML文档 - 王朝网络宽屏版

照着API文档摸索了两天，发现在DOM中，一个注释(Comment)、一个属性(attribute)、一行文本(textNode)、一个元素(Element)都是一个Node。而有子节点的Node被称为元素（Element).

因此处理XML文档最主要的就是在分辨并处理各种不同的Node.

Dom6.java

package doms;

import javax.xml.parsers.*; //这个包被包括在j2ee 1.4.2 API中。

import org.w3c.dom.*; //这个包被包括在j2se 1.5.0 API中。

import org.xml.sax.*; //这个包被包括在j2ee 1.5.0 API中。

public class Dom6 {

public static void main(String[] args) {

Dom6 d6 = new Dom6();

System.out.println(d6.parseXML("K:/test11/xml/test.xml"));

}

private String getDocumentType(Document doc) { //获取DocumentType信息。为简单起见，不涉及对Entity等的解析。

StringBuffer sb = new StringBuffer();

DocumentType type = doc.getDoctype();

String name = type.getName();

String publicId = type.getPublicId();

String systemId = type.getSystemId();

if (name == null) return "";

sb.append("<!DOCTYPE " + name);

sb.append(publicId == null ? "" : " PUBLIC \"" + publicId + "\"");

sb.append(systemId == null ? "" : " \"" + systemId + "\"");

sb.append(">\n");

return sb.toString();

}

private String getElementAttrs(Node node) { //获取一个Element的所有Attribute。

StringBuffer attrs = new StringBuffer();

if (node.hasChildNodes()) {

NamedNodeMap map = node.getAttributes();

for (int i = 0; i < map.getLength(); i++) {

Node attr = map.item(i);

attrs.append(" " + attr.getNodeName() + "=\"" + attr.getNodeValue() + "\"");

}

return attrs.toString();

}

private String getXMLHeader(Document doc) { //获取XML头定义。

StringBuffer header = new StringBuffer();

String encoding = doc.getXmlEncoding();

String version = doc.getXmlVersion();

boolean standalone = doc.getXmlStandalone();

if (version == null || encoding == null) return ""; //如果没有定义XML头，则返回空串。

header.append("<?xml");

header.append(" version=\"" + version + "\"");

header.append(" encoding=\"" + encoding + "\"");

header.append(standalone == false ? "" : " standalone=\"true\"");

header.append("?>\n");

return header.toString();

}

private StringBuffer circle(NodeList list, StringBuffer sb) { //递归调用，获取所有Element和Node。

for (int i = 0; i < list.getLength(); i++) {

Node node = list.item(i);

if (node.hasChildNodes()) { //如果该节点含有子节点，表明它是一个Element。

String nodeName = node.getNodeName();

sb.append("<" + nodeName + this.getElementAttrs(node) + ">"); //获取该Element的所有Attribute。

sb = this.circle(node.getChildNodes(), sb); //递归调用，操作该Element的子节点。

sb.append("</" + nodeName + ">");

} else if (node.getNodeType() == Node.COMMENT_NODE) { //检查这个非Element节点是否是注释。

sb.append("");

} else {

sb.append(node.getNodeValue());

}

return sb;

}

private String parseXML(String xmlFile) { //解析一个XML文档。

StringBuffer sb = new StringBuffer("///////// ParseXML //////////\n");

try {

javax.xml.parsers.DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();

javax.xml.parsers.DocumentBuilder builder = factory.newDocumentBuilder();

org.w3c.dom.Document doc = builder.parse(xmlFile); //获取XML文档.

sb.append(this.getXMLHeader(doc)); //获取XML头定义。

sb.append(this.getDocumentType(doc)); //获取DocumentType信息。

org.w3c.dom.Element rootElement = doc.getDocumentElement(); //获取根元素。

String rootTagName = rootElement.getTagName();

sb.append("<" + rootTagName + this.getElementAttrs(rootElement) + ">");

if (rootElement.hasChildNodes()) { //一般来说，根元素肯定存在子节点。

sb = this.circle(rootElement.getChildNodes(), sb); //递归调用，操作根元素的子节点。

}

sb.append("</" + rootTagName + ">");

} catch (javax.xml.parsers.ParserConfigurationException pce) {

} catch (org.xml.sax.SAXException se) {

} catch (java.io.IOException ioe) {

}

return sb.toString();

}

K:/test11/xml/test.xml

<?xml version="1.0" encoding="GBK"?>

<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">

<web-app>

<display-name>adfadfadsdsafsda</display-name>

<servlet-name>Dom1</servlet-name>

<servlet-class>doms.Dom1</servlet-class>

<init-param>

<param-name>name</param-name>

<param-value>bitan</param-value>

</init-param>

</servlet>

<listener-class>doms.ListenerClass</listener-class>

</listener>

<taglib-uri>tag1.tld</taglib-uri>

<taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>

</taglib>

<myself-tag author="bitan" email="ggjj_zhzz@163.com">

下面是一些信息：

<test-time>2005年1月14日</test-time>

<jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>

<text-editer>UltraEdit-32</text-editer>

测试结束。

</myself-tag>

</web-app>

结果：

K:\test11>javac -classpath %classpath% -d .\web-inf\classes .\src\Dom6.java

K:\test11>java -classpath .\web-inf\classes doms.Dom6

///////// ParseXML //////////