照着API文档摸索了两天,发现在DOM中,一个注释(Comment)、一个属性(attribute)、一行文本(textNode)、一个元素(Element)都是一个Node。而有子节点的Node被称为元素(Element).
因此处理XML文档最主要的就是在分辨并处理各种不同的Node.
Dom6.java
package doms;
import javax.xml.parsers.*; //这个包被包括在j2ee 1.4.2 API中。
import org.w3c.dom.*; //这个包被包括在j2se 1.5.0 API中。
import org.xml.sax.*; //这个包被包括在j2ee 1.5.0 API中。
public class Dom6 {
public static void main(String[] args) {
Dom6 d6 = new Dom6();
System.out.println(d6.parseXML("K:/test11/xml/test.xml"));
}
private String getDocumentType(Document doc) { //获取DocumentType信息。为简单起见,不涉及对Entity等的解析。
StringBuffer sb = new StringBuffer();
DocumentType type = doc.getDoctype();
String name = type.getName();
String publicId = type.getPublicId();
String systemId = type.getSystemId();
if (name == null) return "";
sb.append("<!DOCTYPE " + name);
sb.append(publicId == null ? "" : " PUBLIC \"" + publicId + "\"");
sb.append(systemId == null ? "" : " \"" + systemId + "\"");
sb.append(">\n");
return sb.toString();
}
private String getElementAttrs(Node node) { //获取一个Element的所有Attribute。
StringBuffer attrs = new StringBuffer();
if (node.hasChildNodes()) {
NamedNodeMap map = node.getAttributes();
for (int i = 0; i < map.getLength(); i++) {
Node attr = map.item(i);
attrs.append(" " + attr.getNodeName() + "=\"" + attr.getNodeValue() + "\"");
}
}
return attrs.toString();
}
private String getXMLHeader(Document doc) { //获取XML头定义。
StringBuffer header = new StringBuffer();
String encoding = doc.getXmlEncoding();
String version = doc.getXmlVersion();
boolean standalone = doc.getXmlStandalone();
if (version == null || encoding == null) return ""; //如果没有定义XML头,则返回空串。
header.append("<?xml");
header.append(" version=\"" + version + "\"");
header.append(" encoding=\"" + encoding + "\"");
header.append(standalone == false ? "" : " standalone=\"true\"");
header.append("?>\n");
return header.toString();
}
private StringBuffer circle(NodeList list, StringBuffer sb) { //递归调用,获取所有Element和Node。
for (int i = 0; i < list.getLength(); i++) {
Node node = list.item(i);
if (node.hasChildNodes()) { //如果该节点含有子节点,表明它是一个Element。
String nodeName = node.getNodeName();
sb.append("<" + nodeName + this.getElementAttrs(node) + ">"); //获取该Element的所有Attribute。
sb = this.circle(node.getChildNodes(), sb); //递归调用,操作该Element的子节点。
sb.append("</" + nodeName + ">");
} else if (node.getNodeType() == Node.COMMENT_NODE) { //检查这个非Element节点是否是注释。
sb.append("<!--" + node.getNodeValue() + "-->");
} else {
sb.append(node.getNodeValue());
}
}
return sb;
}
private String parseXML(String xmlFile) { //解析一个XML文档。
StringBuffer sb = new StringBuffer("///////// ParseXML //////////\n");
try {
javax.xml.parsers.DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
javax.xml.parsers.DocumentBuilder builder = factory.newDocumentBuilder();
org.w3c.dom.Document doc = builder.parse(xmlFile); //获取XML文档.
sb.append(this.getXMLHeader(doc)); //获取XML头定义。
sb.append(this.getDocumentType(doc)); //获取DocumentType信息。
org.w3c.dom.Element rootElement = doc.getDocumentElement(); //获取根元素。
String rootTagName = rootElement.getTagName();
sb.append("<" + rootTagName + this.getElementAttrs(rootElement) + ">");
if (rootElement.hasChildNodes()) { //一般来说,根元素肯定存在子节点。
sb = this.circle(rootElement.getChildNodes(), sb); //递归调用,操作根元素的子节点。
}
sb.append("</" + rootTagName + ">");
} catch (javax.xml.parsers.ParserConfigurationException pce) {
} catch (org.xml.sax.SAXException se) {
} catch (java.io.IOException ioe) {
}
return sb.toString();
}
}
K:/test11/xml/test.xml
<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app>
<!-- Display Name Field -->
<display-name>adfadfadsdsafsda</display-name>
<!-- Servlet Defination -->
<servlet>
<servlet-name>Dom1</servlet-name>
<servlet-class>doms.Dom1</servlet-class>
<init-param>
<param-name>name</param-name>
<param-value>bitan</param-value>
</init-param>
</servlet>
<!-- Listener List -->
<listener>
<listener-class>doms.ListenerClass</listener-class>
</listener>
<!-- Tag Library Mapping -->
<taglib>
<taglib-uri>tag1.tld</taglib-uri>
<taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>
</taglib>
<!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->
<myself-tag author="bitan" email="ggjj_zhzz@163.com">
下面是一些信息:
<test-time>2005年1月14日</test-time>
<jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>
<text-editer>UltraEdit-32</text-editer>
测试结束。
</myself-tag>
</web-app>
结果:
K:\test11>javac -classpath %classpath% -d .\web-inf\classes .\src\Dom6.java
K:\test11>java -classpath .\web-inf\classes doms.Dom6
///////// ParseXML //////////
<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN
" "http://java.sun.com/dtd/web-app_2_3.dtd">
<web-app>
<!-- Display Name Field -->
<display-name>adfadfadsdsafsda</display-name>
<!-- Servlet Defination -->
<servlet>
<servlet-name>Dom1</servlet-name>
<servlet-class>doms.Dom1</servlet-class>
<init-param>
<param-name>name</param-name>
<param-value>bitan</param-value>
</init-param>
</servlet>
<!-- Listener List -->
<listener>
<listener-class>doms.ListenerClass</listener-class>
</listener>
<!-- Tag Library Mapping -->
<taglib>
<taglib-uri>tag1.tld</taglib-uri>
<taglib-location>/WEB-INF/tlds/tag1.tld</taglib-location>
</taglib>
<!-- 自定义的一个标记。用来测试对Attribute和TextNode的解析情况 -->
<myself-tag author="bitan" email="ggjj_zhzz@163.com">
下面是一些信息:
<test-time>2005年1月14日</test-time>
<jdk-version nickname="tiger">j2sdk 1.5.0_01</jdk-version>
<text-editer>UltraEdit-32</text-editer>
测试结束。
</myself-tag>
</web-app>
K:\test11>