分享
 
 
 

XML文档对象模型分析

王朝other·作者佚名  2006-12-16
窄屏简体版  字體: |||超大  

XML DOM 对象提供了一个标准的方法来操作存储在XML文档中的信息,DOM应用编程接口(API)用来作为应用程序和XML文档之间的桥梁。

DOM可以认为是一个标准的结构体系用来连接文档和应用程序(也可以是剧本语言)。MSXML解析器允许你装载和创建一个文档,收集文档的错误信息,得到和操作文档中的所有的信息和结构,并把文档保存在一个XML文件中。DOM提供给用户一个接口来装载、到达和操作并序列化XML文档。DOM提供了对存储在内存中的XML文档的一个完全的表示,提供了可以随机访问整个文档的方法。DOM允许应用程序根据MSXML解析器提供的逻辑结构来操作XML文档中的信息。利用MSXML所提供的接口来操作XML。

实际上MSXML解析器根据XML文档生成一个DOM树结构,它能够读XML文档并根据XML文档内容创建一个节点的逻辑结构,文档本身被认为是一个包含了所有其他节点的节点。

DOM使用户能够把文档看成是一个有结构的信息树,而不是简单的文本流。这样应用程序或者是剧本即使不知道XML的语义细节也能够方便的操作该结构。DOM包含两个关键的抽象:一个树状的层次、另一个是用来表示文档内容和结构的节点集合。树状层次包括了所有这些节点,节点本身也可以包含其他的节点。这样的好处是对于开发人员来说,他可以通过这个层次结构来找到并修改相应的某一个节点的信息。DOM把节点看成是一个通常的对象,这样就有可能创建一个剧本来装载一个文档,然后遍历所有的节点,显示感兴趣的节点的信息。注意节点可以有很多中具体的类型,比如元素、属性和文本都可以认为是一个节点。

微软的MSXML解析器读一个XML文档,然后把它的内容解析到一个抽象的信息容器中称为节点(NODES)。这些节点代表文档的结构和内容,并允许应用程序来读和操作文档中的信息而不需要显示的知道XML的语义。在一个文档被解析以后,它的节点能够在任何时候被浏览而不需要保持一定的顺序。

对开发人员来说,最重要的编程对象是DOMDocument。DOMDocument对象通过暴露属性和方法来允许你浏览,查询和修改XML文档的内容和结构,每一个接下来的对象暴露自己的属性和方法,这样你就能够收集关于对象实例的信息,操作对象的值和结构,并导航到树的其他对象上去。

MSXML.DLL所包括的主要的COM接口有:

(1) DOMDocument

DOMDocument对象是XML DOM的基础,你可以利用它所暴露的属性和方法来允许你浏览、查询和修改XML文档的内容和结构。DOMDocument表示了树的顶层节点。它实现了DOM文档的所有的基本的方法并且提供了额外的成员函数来支持XSL和XSLT。它创建了一个文档对象,所有其他的对象都可以从这个文档对象中得到和创建。

(2) IXMLDOMNode

IXMLDOMNode是文档对象模型(DOM)中的基本的对象,元素,属性,注释,过程指令和其他的文档组件都可以认为是IXMLDOMNode,事实上,DOMDocument对象本身也是一个IXMLDOMNode对象。

(3) IXMLDOMNodeList

IXMLDOMNodeList实际上是一个节点(Node)对象的集合,节点的增加、删除和变化都可以在集合中立刻反映出来,可以通过"for…next"结构来遍历所有的节点。

(4) IXMLDOMParseError

IXMLDOMParseError接口用来返回在解析过程中所出现的详细的信息,包括错误号,行号,字符位置和文本描述。

||||||下面主要描述一个DOMDocument对象的创建过程,这里我们用VC描述创建一个文档对象的过程。

HRESULT hr;

IXMLDomDocument* pXMLDoc;

IXMLDOMNode* pXDN;

Hr=CoInitialize(NULL); file://COM的初始化

file://得到关于IXMLDOMDocument接口的指针pXMLDOC。

hr=CoCreateInstance(CLSID_DOMDocument,NULL,CLSCTX_INPPROC_SERVER,

IID_IXMLDOMDocument,(void**)&pXMLDoc);

file://得到关于IXMLDOMNode接口的指针pXDN。

hr=pXMLDoc->QueryInterface(IID_IXMLDOMNode,(void**)&pXDN);

在MSXML解析器使用过程中,我们可以使用文档中的createElement方法来创建一个节点装载和保存XML文件。通过load或者是loadXML方法可以从一个指定的URL来装载一个XML文档。Load(LoadXML)方法带有两个参数:第一个参数xmlSource表示需要被解析的文档,第二个参数isSuccessful表示文档装载是否成功。Save方法是用来把文档保存到一个指定的位置。Save方法有一个参数destination用来表示需要保存的对象的类型,对象可以是一个文件,一个ASP Response方法,一个XML文档对象,或者是一个能够支持持久保存(persistence)的客户对象。下面是save方法使用的一个简单的例子:

BOOL DOMDocSaveLocation()

{

BOOL bResult = FALSE;

IXMLDOMDocument *pIXMLDOMDocument = NULL;

HRESULT hr;

try

{

_variant_t varString = _T("D:\\sample.xml");

// 这里需要创建一个DOMDocument对象和装载XML文档,代码省略.

hr = pIXMLDOMDocument->save(varString); file://保存文档到D:\\sample.xml中去。

if(SUCCEEDED(hr))

bResult = TRUE;

}

catch(...)

{

DisplayErrorToUser();

// 这里需要释放对IXMLDOMDocument接口的引用,代码省略。

}

return bResult;

}

||||||同时,在解析过程中,我们需要得到和设置解析标志。利用不同的解析标志,我们可能以不同的方法来解析一个XML文档。XML标准允许解析器验证或者不验证文档,允许不验证文档的解析过程跳过对外部资源的提取。另外,你可能设置标志来表明你是否要从文档中移去多余的空格。

为了达到这个目的,DOMDocument对象暴露了下面几个属性,允许用户在运行的时候改变解析器的行为:

1. Async(相对于C++是两个方法,分别为get_async和put_async)

2.ValidateOnparse (相对于C++是两个方法,分别为get_validateOnParse和 put_validateOnParse)

3. ResolveExternals(相对于C++是两个方法,分别为get_ ResolveExternals和put_ ResolveExternals)

4. PersercveWhiteSpace(相对于C++是两个方法,分别为get_ PersercveWhiteSpace和put_ PersercveWhiteSpace)

每一个属性可以接受或者返回一个Boolean值。缺省的,anync,validateOnParse,resolveExternals的值为TRUE,perserveWhiteSpace的值跟XML文档的设置有关,如果XML文档中设置了xml:space属性的话,该值为FALSE。

同时在文档解析过程中可以收集一些和文档信息的信息,实际上在文档解析过程中可以得到以下的信息:

1. doctype(文档类型):实际上是和用来定义文档格式的DTD文件。如果XML文档没有相关的DTD文档的话,它就返回NULL。

2. implementation(实现):表示该文档的实现,实际上就是用来指出当前文档所支持的XML的版本。

3. parseError(解析错误):在解析过程中最后所发生的错误。

4. readyState(状态信息):表示XML文档的状态信息,readyState对于异步使用微软的XML解析器来说的重要作用是提高了性能,当异步装载XML文档的时候,你的程序可能需要检查解析的状态,MSXML提供了四个状态,分别为正在状态,已经状态,正在解析和解析完成。

5. url(统一资源定位):关于正在被装载和解析的XML文档的URL的情况。注意如果该文档是在内存中建立的话,这个属性返回NULL值。

在得到文档树结构以后,我们可以操作树中的每一个节点,可以通过两个方法得到树中的节点,分别为nodeFromID和getElementsByTagName。

nodeFromID包括两个参数,第一个参数idString用来表示ID值,第二个参数node返回指向和该ID相匹配的NODE节点的接口指针。注意根据XML的技术规定,每一个XML文档中的ID值必须是唯一的而且一个元素(element)仅且只能和一个ID相关联。

getElementsByTagName方法有两个参数,第一个参数tagName表示需要查找的元素(Element)的名称,如果tagName为"*"的话返回文档中所有的元素(Element)。第二个参数为resultList,它实际是指向接口IXMLDOMNodeList的指针,用来返回和tagName(标签名字)相关的所有的Node的集合。

下面是一个简单的例子:

IXMLDOMDocument *pIXMLDOMDocument = NULL;

wstring strFindText (_T("author"));

IXMLDOMNodeList *pIDOMNodeList = NULL;

IXMLDOMNode *pIDOMNode = NULL;

long value;

BSTR bstrItemText;

HRESULT hr;

try

{

file:// 创建一个DOMDocument文档对象,并装载具体文档,相关代码省略。

file://下面的代码用来得到一个和标签名称author相关的所有的节点集合

hr = pIXMLDOMDocument->getElementsByTagName(

(TCHAR*)strFindText.data(), &pIDOMNodeList);

SUCCEEDED(hr) ? 0 : throw hr;

file://是否正确的得到了指向IDOMNodeList的指针。

hr = pIDOMNodeList->get_length(&value); file://得到所包含的NODE节点的个数

if(SUCCEEDED(hr))

{

pIDOMNodeList->reset();

for(int ii = 0; ii < value; ii++)

{

file://得到具体的一个NODE节点

pIDOMNodeList->get_item(ii, &pIDOMNode);

if(pIDOMNode )

{

pIDOMNode->get_text(&bstrItemText); file://得到该节点相关的文本信息

::MessageBox(NULL, bstrItemText,strFindText.data(), MB_OK);

pIDOMNode->Release();

pIDOMNode = NULL;

}

}

}

pIDOMNodeList->Release();

pIDOMNodeList = NULL;

}

catch(...)

{

if(pIDOMNodeList)

pIDOMNodeList->Release();

if(pIDOMNode)

pIDOMNode->Release();

DisplayErrorToUser();

}

最后我们讨论一下如何来创建新的节点,实际上可以通过方法createNode来创建一个新的节点。CreateNode包括四个参数,第一个参数Type表示要创建的节点的类型,第二个参数name表示新节点的nodeName的值,第三个参数namespaceURI表示该节点相关的名字空间,第四个参数node表示新创建的节点。注意可以通过使用已经提供的类型(Type),名称(name)和名字空间(nodeName)来创建一个节点。

当一个节点被创建的时候,它实际上是在一个名字空间范围(如果已经提供了名字空间的话)内创建的。如果没有提供名字空间的话,它实际上是在文档的名字空间范围内创建的。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有