分享
 
 
 

使用JAXP处理XML文件

王朝other·作者佚名  2008-05-31
窄屏简体版  字體: |||超大  

JAXP是java API for xml PRocessing的缩写。JAXP API主要的部分在javax.xml.parsers 这个包中。在这个包中,向用户提供了两个最重要的工厂类,SAXParserFactory 和DocumentBuilderFactory,相应地,提供了SAXParser 和DocumentBuilder两个类。

SAX是由XML-DEV定义的;DOM是由W3C定义的。让我们来看看这些API库。

javax.xml.parsers

JAXP API, 定义个SAX和DOM的一个通用接口

org.w3c.dom

定义了DOM中的所有组件

org.xml.sax

定义了SAX的所有API

javax.xml.transform

定义了XSLT API,使用它,你可以将XML转化为一般的可视的页面。

SAX指一种"事件驱动"的处理方式,他对XML文件连续地一个对象一个对象地操作,由于它的这个特点,所以它可以用于服务器端或者对速度有非凡要求的地方。

相比较而言DOM是个使用起来更简单些。他是将所有个XML数据全部读到内存里面,然后使用"树"结构将这些数据组织起来,用户可以对XML的数据进行任意的操作。

至于XSLT,我们在这里就不介绍太多,假如感爱好请参考相应的资料。我们还是先看看SAX。

SAX

SAX的框架轮廓

系统是从SAXParserFactory产生parser的实例开始的。一个parser中包含了一个SAXReader对象,当这个parser调用parse方法的时候,这个reader就调用回调方法已实现这个应用;而这些方法呢?是定义在ContentHandler,ErrorHandler,DTDHandler and EntityResolver接口中的。

以下是对SAX API库的概述:

SAXParserFactory

SAXParserFactory是一个根据系统属性生成parser实例的一个对象。

SAXParser

SAXParser是一个定义了不同种类的parser()方法的接口。一般而言,你向parser传XML数据后,使用DefaultHandler再来处理,系统就会调用一些合适的方法来处理XML文件,这样的一种处理方法是最为简单的。

SAXReader

SAXParser包含了一个SAXReader,通常你是不需要关心它的,但是当你要使用SAXReader的getXMLReader()方法的时候,你就需要配置他。简言之,SAXParser就是一个与SAX事件通讯的处理器,这样,你就可以使用自定义的handler。

DefaultHandler

DefaultHandler 实现了 ContentHandler, ErrorHandler, DTDHandler, 和EntityResolver 接口 (当然其中有一些null方法), 假如你感爱好的话,你可以在你的程序中重载它。

ContentHandler

当读到XML的tag时,就会调用到这个接口中的startDocument, endDocument, startElement, 和 endElement 方法。同时,这个接口还定义了characters 和processingInstrUCtion,方法,分别地,当parser碰到XML的element或者inline processing instruction的时候调用。

ErrorHandler

当碰到不同类型的错误的时候分别调用相应的"错误"方法,这些方法包括:error,fatalError和warning。

DTDHandler

该接口所定义的方法只用在处理DTD信息的时候。

EntityResolver

给接口中的resolveEntity方法只在parser碰到URI标识数据的时候才调用。

更具体地api介绍,请参看SAX的官方API文档。

例子:

在我们这个例子中,我们处理一个xml文件,然后将其值set到对象中。这是一个非经常用的使用情况。以下就是我们需要处理的xml文件。

Test.xml

<?xml version="1.0" ?>

<customers>

<customer>

<id>#001</id>

<name>Micke</name>

<address>Najing</address>

</customer>

<customer>

<id>#002</id>

<name>Car</name>

<address>Suzhou</address>

</customer>

<customer>

<id>#003</id>

<name>Jimmy</name>

<address>ChengDu</address>

</customer>

<customer>

<id>#004</id>

<name>Henry</name>

<address>Xi'an</address>

</customer>

</customers>

这是一个非常简单的xml文件,customers中间有数个customer,每一个customer中包含三个属性id, name, address。

根据这个xml文件,我们将Date Object设置如下。

/*

* Customers.java

* Create @ 2004-4-27 22:04:45

* by Jiabo

*/

import java.util.*;

/**

* Customers

* Create @ 2004-4-27 22:04:45

* by Jiabo

*/

public class Customers {

private Vector customers;

public Customers() {

customers = new Vector();

}

public void addCustomer(Customer customer) {

customers.add(customer);

}

public String toString() {

String newline = System.getProperty("line.separator");

StringBuffer buf = new StringBuffer();

for (int i = 0; i < customers.size(); i++) {

buf.append(customers.elementAt(i)).append(newline);

}

return buf.toString();

}

}

class Customer {

private String id;

private String name;

private String address;

/**

* @return

*/

public String getAddress() {

return address;

}

/**

* @return

*/

public String getId() {

return id;

}

/**

* @return

*/

public String getName() {

return name;

}

/**

* @param string

*/

public void setAddress(String string) {

address = string;

}

/**

* @param string

*/

public void setId(String string) {

id = string;

}

/**

* @param string

*/

public void setName(String string) {

name = string;

}

public String toString(){

return "Customer: ID='" + id + "' Name='" + name +

"' Address='" + address + "'";

}

}

接下来是xml的处理器。

/*

* Test.java

* Created on 2004-4-10

* by Jiabo

*/

import java.util.*;

import org.xml.sax.*;

import org.xml.sax.helpers.DefaultHandler;

/**

* Test

* Create on 2004-4-10 19:20:27

* by Jiabo

*/

public class Unmarshaller extends DefaultHandler {

private Customers customers;

private Stack stack;

private boolean isStackReadyForText;

private Locator locator;

/**

* init

*/

public Unmarshaller() {

stack = new Stack();

isStackReadyForText = false;

}

/**

* @return customers

*/

public Customers getCustomers() {

return customers;

}

/**

* callbacks

*/

public void setDocumentLocator(Locator rhs) {

locator = rhs;

}

//==========================================

// SAX DocumentHandler methods

//==========================================

public void startElement(

String uri,

String sName,

String qName,

Attributes attrs) {

isStackReadyForText = false;

if (sName.equals("customers")) {

stack.push(new Customers());

} else if (sName.equals("customer")) {

stack.push(new Customer());

} else if (

sName.equals("id")

sName.equals("name")

sName.equals("address")) {

stack.push(new StringBuffer());

isStackReadyForText = true;

} else {

}

}

public void endElement(String namespaceURI, String sName, String qName){

isStackReadyForText = false;

Object temp = stack.pop();

if (sName.equals("customers")) {

customers = (Customers) temp;

} else if (sName.equals("customer")) {

((Customers) stack.peek()).addCustomer((Customer) temp);

} else if (sName.equals("id")) {

((Customer) stack.peek()).setId(temp.toString());

} else if (sName.equals("name")) {

((Customer) stack.peek()).setName(temp.toString());

} else if (sName.equals("address")) {

((Customer) stack.peek()).setAddress(temp.toString());

}

}

public void characters(char[] data, int start, int length) {

if (isStackReadyForText == true) {

((StringBuffer) stack.peek()).append(data, start, length);

} else {

}

}

}

在这里我们处理xml文件的思路非常简单,就是使用一个栈,碰到"<"表示element的开始,然后就看与我们既定的Data Object的名字是否相符合,符合就new一个该对象,并将其压栈;不符合就什么都不做,sax的处理框架就会自己去处理下一个element。而当碰到"/>"的时候我们还是看的他名字与DataObject的名字是否相符,相符合的话就出栈,然后set进对象里面。如此循环,就处理完了我们上面那个简单得xml文件。

我们需要做的事情就只有这些。其他如何处理的,handler回自己调用相应的startElement,endElement等方法去处理。

以下是程序的入口:

/*

* main.java

* Create @ 2004-4-27 22:18:41

* by Jiabo

*/

import java.io.*;

import javax.xml.parsers.*;

import org.xml.sax.*;

/**

* main

* Create @ 2004-4-27 22:18:41

* by Jiabo

*/

public class Main {

public static void main(String args[]) {

Customers customers = null;

if (args.length != 1) {

System.err.println("Usage: cmd filename");

System.exit(1);

}

try {

Unmarshaller handler = new Unmarshaller();

SAXParserFactory factory = SAXParserFactory.newInstance();

SAXParser saxParser = factory.newSAXParser();

File file = new File(args[0]);

InputSource src = new InputSource(new FileInputStream(file));

saxParser.parse( src ,handler);

customers = handler.getCustomers();

} catch (Throwable t) {

t.printStackTrace();

}

System.out.println(customers);

}

}

如前面所述,通过一个工厂方法得到一个SAXParser的实例,然后就可以编译这个xml文件了。这样你就可以得到如下结果:

Customer: ID ='#001' Name='Micke' Address='Najing'

Customer: ID ='#002' Name='Car' Address='Suzhou'

Customer: ID ='#003' Name='Jimmy' Address='ChengDu'

Customer: ID ='#004' Name='Henry' Address='Xi'an'

Sax的系统框架中还有其他得好些方法,读者不妨试试他们是如何使用的,这对以后实战处理xml文件会有很大的方便。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有