分享
 
 
 

基于事件解析的SAX模型分析

王朝other·作者佚名  2006-11-24
窄屏简体版  字體: |||超大  

SAX2解析器读XML文档,然后产生基于特殊符号的事件。SAX2解析器实际上并不为该文档在内存中创建一棵树结构,它序列的处理一个文档的内容并产生相关的事件。

比如,当你进行基于事件的编程的时候,你可以创建函数来响应用户定义的事件(比如OnClick事件)。在利用SAX进行编程的时候,需要注意的是,是解析器而不是用户产生事件。

比如考虑下面一个简单的文档。

<?xml version="1.0"?>

<parts>

<part>TurboWidget</part>

</parts>

当SAX2在处理这个文档的时候,它产生如下的一系列的事件:

StartDocument( )

StartElement( "parts" )

StartElement( "part" )

Characters( "TurboWidget" )

EndElement( "part" )

EndElement( "parts" )

EndDocument( )

可以把SAX2看成是一个有拉特点(PUSH)的解析器,SAX2产生事件,然后你可以自己去处理些事件。实际上,当SAX2在解析一个文档的时候,SAXXMLReader读该文档并产生一系列的事件,你可以选择一些事件进行处理。

创建一个应用SAX的应用程序框架

SAX2产生的事件包括如下的种类:

¨ 和XML文档内容相关的事件(ISAXContentHandler)

¨ 和DTD相关的事件(ISAXDTDHandler)

¨ 出现错误时发生的事件(ISAXErrorHandler)

为了处理这些事件,你需要实现一个相关的处理类,该处理类需要包含一些方法来处理相关的事件。你必须对你想要处理的事件实现相关的处理。如果你不想处理某一个事件的话,只需要简单的忽略它就可以。在实际应用中,我们首先要继承这些接口,用C++我们可以创建一个类,在这个类的方法中,我们可以告诉应用程序在接收到一个事件的时候如何进行处理。下面是建立一个基于SAX的应用的基本步骤:

1. 创建头文件当使用SAX2的时候,我们需要用到动态连接库MSXML.DLL,为了使用MSXML中包含的SAX2接口,你必须在程序的头文件(一般在stdafx.h中)中包含下列的代码:

#import raw_interfaces_only

using namespace MSXML2;

2. 建立具体的操作(handler)类,SAX2主要定义了三个基本的操作类,它们分别是ISAXContentHandler,ISAXDTDHandler和ISAXErrorHandler。

ISAXContentHandler是用来处理SAX2解析器对文档内容进行解析时所产生的消息的,ISAXXMLReader通过方法putContentHandler来注册这个实例。而ISAXDTDHandler是用来处理和DTD相关的基本的消息的,ISAXXMLReader通过方法putDTDHandler来注册这个实例。ISAXErrorHandler提供了对在解析过程中遇到错误时产生的错误事件的处理,ISAXXMLReader通过方法putErrorHandler来注册这个实例

因为这三个类都是用来对事件进行处理的,并且需要在接口ISAXXMLReader中进行注册。但是它们的基本使用方法类似,所以我们这里只详细描述对接口ISAXContentHandler 的操作。

ISAXContentHandler接口接收关于文档的内容变化的事件,这是实现SAX应用所需要的最重要的接口,如果应用在遇到基本的解析事件的时候需要被通知的话,ISAXXMLReader通过方法putContentHandler来注册这个实例,然后ISAXXMLReader就使用这个实例来报告基于文档的事件,比如元素的开始,元素的结束和相关的字符串数据等等。ISAXContentHandler 包括了很多的方法:比如startDocument,endDocument,startElement,endElement等等。实际上它包含了好接个startXXX和endXXX对来建立不同的信息集合的抽象。比如startDocument方法在文档信息开始的时候被调用,而在startDocument以后被调用的方法就被认为是文档信息项(item)的子项。在文档信息内容结束的时候endDocument就被调用,表示文档信息的结束。 实际上是SAX2在解析文档的时候,当处于文档某一位置的时候,会激发相应的方法,比如当一个文档开始的时候,就会激发startDocument方法,在实际实现的时候,我们可以在我们继承ISAXContentHandler类的实现类中,重载该方法,实现我们自己想要的处理。我们可以把这些方法看成是ISAXContentHandler接口提供给我们的。需要注意的是事件被处理的顺序和信息在文档中的位置是一致的。

同时需要注意的是,如果我们需要在我们的应用中对这些消息进行处理的话,我们就要继承处理这些消息的类,比如我们只需要对文档内容进行处理,而忽略对DTD和解析过程中错误(Error)的处理,那么我们只需要创建一个新的类,该类继承ISAXContentHandler接口,因为ISAXContentHandler中定义了很多的事件处理方法,而事实上我们只需要对我们所关心事件的处理方法进行重载,对我们不关心的事件可以简单的忽略它。

比如我们只关心startElement和endElement事件,而且我们假设我们建立的类的名称为CXMLContentDeal,我们的类就可以如下面所示:

class CXMLContentDeal : public ISAXContentHandler

{

public:

CXMLContentDeal();

virtual CXMLContentDeal ();

virtual HRESULT STDMETHODCALLTYPE startElement(

/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,

/* [in] */ int cchNamespaceUri,

/* [in] */ wchar_t __RPC_FAR *pwchLocalName,

/* [in] */ int cchLocalName,

/* [in] */ wchar_t __RPC_FAR *pwchRawName,

/* [in] */ int cchRawName,

/* [in] */ ISAXAttributes __RPC_FAR *pAttributes);

virtual HRESULT STDMETHODCALLTYPE endElement(

/* [in] */ wchar_t __RPC_FAR *pwchNamespaceUri,

/* [in] */ int cchNamespaceUri,

/* [in] */ wchar_t __RPC_FAR *pwchLocalName,

/* [in] */ int cchLocalName,

/* [in] */ wchar_t __RPC_FAR *pwchRawName,

/* [in] */ int cchRawName);

}

然后我们可以重载方法startElement和endElement来进行和应用相关的特殊的处理。

3. 通过接口ISAXXMLReader创建一个解析器。XMLReader是SAX应用实现的主要的接口,XMLReader的作用是这样的。首先,XML的开发人员使用这个接口来注册他们对其他SAX接口的实现(比如ContentHandler,DTDHandler,ErrorHandler等等),另外,XMLREADER通过setFeature和setProperty两个方法来配置SAX解析器的行为,最后,XMLReader封装了解析的功能。示例代码如下:

ISAXXMLReader* pRdr = NULL;

HRESULT hr = CoCreateInstance(

__uuidof(SAXXMLReader),

NULL,

CLSCTX_ALL,

__uuidof(ISAXXMLReader),

(void **)&pRdr);

4. 创建相应的事件(handler)处理类,这里不妨假设我们只处理和文档内容相关的事件。示例代码如下:

CXMLContentDeal * pMc = new CXMLContentDeal();

注意这里CXMLContentDeal是继承接口ISAXContentHandler的类。

5.在解析器中注册事件处理类,示例代码如下:

hr = pRdr->putContentHandler(pMc);

6.开始进行文档的解析,示例代码如下

hr = pRdr->parseURL(URL); file://这里的URL是指一个具体XML文档的位置

7.释放解析器对象

pRdr->Release();

以上就是基于SAX的应用程序的框架结构,我们可以看到,实际的事件处理是在我们的继承类CXMLContentDeal中实现的,在我们这个示例代码中,每当文档中一个新的元素开始的时候,都会激活方法startElement,每当一个元素结束的时候,都会激活方法endElement。我们可以在startElement和endElement中写入和应用相关的特定的代码。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有