分享
 
 
 

SAX之Java实现学习笔记(一)

王朝java/jsp·作者佚名  2006-01-08
窄屏简体版  字體: |||超大  

SAX之Java实现学习笔记(一)

本文假设读者对XML有些了解

首先,先给出一个比较基本的处理xml文件的程序。你不必细看,直接跳过即可。需要时可以返回来看。

Echo01.java

import java.io.*;

import org.xml.sax.*;

import org.xml.sax.helpers.DefaultHandler;

import javax.xml.parsers.SAXParserFactory;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.parsers.SAXParser;

public class Echo01 extends DefaultHandler

{

StringBuffer textBuffer;

public static void main(String argv[])

{

if (argv.length != 1) {

System.err.println("Usage: cmd filename");

System.exit(1);

}

// Use an instance of ourselves as the SAX event handler

DefaultHandler handler = new Echo01();

// Use the default (non-validating) parser

SAXParserFactory factory = SAXParserFactory.newInstance();

try {

// Set up output stream

out = new OutputStreamWriter(System.out, "UTF-8");

// Parse the input

SAXParser saxParser = factory.newSAXParser();

saxParser.parse( new File(argv[0]), handler);

} catch (Throwable t) {

t.printStackTrace();

}

System.exit(0);

}

static private Writer out;

//===========================================================

// SAX DocumentHandler methods

//===========================================================

public void startDocument()

throws SAXException

{

emit("<?xml version='1.0' encoding='UTF-8'?>");

nl();

}

public void endDocument()

throws SAXException

{

try {

nl();

out.flush();

} catch (IOException e) {

throw new SAXException("I/O error", e);

}

}

public void startElement(String namespaceURI,

String sName, // simple name

String qName, // qualified name

Attributes attrs)

throws SAXException

{

echoText();

String eName = sName; // element name

if ("".equals(eName)) eName = qName; // not namespaceAware

emit("<"+eName);

if (attrs != null) {

for (int i = 0; i < attrs.getLength(); i++) {

String aName = attrs.getLocalName(i); // Attr name

if ("".equals(aName)) aName = attrs.getQName(i);

emit(" ");

emit(aName+"=\""+attrs.getValue(i)+"\"");

}

}

emit(">");

}

public void endElement(String namespaceURI,

String sName, // simple name

String qName // qualified name

)

throws SAXException

{

echoText();

String eName = sName; // element name

if ("".equals(eName)) eName = qName; // not namespaceAware

emit("</"+eName+">");

}

public void characters(char buf[], int offset, int len)

throws SAXException

{

String s = new String(buf, offset, len);

if (textBuffer == null) {

textBuffer = new StringBuffer(s);

} else {

textBuffer.append(s);

}

}

//===========================================================

// Utility Methods ...

//===========================================================

// Display text accumulated in the character buffer

private void echoText()

throws SAXException

{

if (textBuffer == null) return;

String s = ""+textBuffer;

emit(s);

textBuffer = null;

}

// Wrap I/O exceptions in SAX exceptions, to

// suit handler signature requirements

private void emit(String s)

throws SAXException

{

try {

out.write(s);

out.flush();

} catch (IOException e) {

throw new SAXException("I/O error", e);

}

}

// Start a new line

private void nl()

throws SAXException

{

String lineEnd = System.getProperty("line.separator");

try {

out.write(lineEnd);

} catch (IOException e) {

throw new SAXException("I/O error", e);

}

}

}

从程序中可以看出,解析一个XML文件的核心语句是下面一部分:

// Use an instance of ourselves as the SAX event handler

DefaultHandler handler = new Echo01();

// Use the default (non-validating) parser

SAXParserFactory factory = SAXParserFactory.newInstance();

try {

// Set up output stream

out = new OutputStreamWriter(System.out, "UTF-8");

// Parse the input

SAXParser saxParser = factory.newSAXParser();

saxParser.parse( new File(argv[0]), handler);

} catch (Throwable t) {

t.printStackTrace();

}

先是创建一个SAXParserFactory工厂类的实例,然后通过SAXParser saxParser = factory.newSAXParser(); 这个工厂类的方法创建了一个saxParser。将xml文件(new File(argv[0]))和一个Sax Event Handler(handler)(在这个程序里面,这个Handler其实是本身这个类,这个类继承了org.xml.sax.helpers.DefaultHandler 这个类,并且在前面初始化了它:DefaultHandler handler = new Echo01(); )传递给它,让它进行解析。

关于xml文件的解析过程中的处理全部在Handler里面实现。一般Parser接受的是DefaultHandler或者HandlerBase这两个类。 这个例子里面的类是继承DefaultHandler这个虚类的。看下图:

而DefaultHandler是实现了EntityResolver, DTDHandler, ContentHandler, ErrorHandler四个接口的虚类。分别定义了如下的方法:

不同的方法,在不同的时候被Parser调用,(这个不同的时候就是Event-based)

详细介绍:(暂略)

DefualtHandler的UML图如下:

看完Handler,再转过头去看Parser,在代码里面用的是SAXParser(SAXParser saxParser)

仔细看里面的代码

你会发现,其实它并没有自己完成解析的工作,而是Wrap了另二个类XMLReader和Parser来完成解析工作。原来SAXParser只是起到一个Adapter的工作而已。

UML:

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有