XML 初级教程(一)
作者:我本楚狂人
一、XML是什么?
XML即extensibe markup language的缩写,也就是可扩展标识语言。
它是作为一种通用数据结构而出现的,尽管它曾被认为取代html。
实际上我们可以将其看作"文本数据库" 。 XML文件通常需要一个验证文件,就像数据库的字符段表一样。常用的为DTD文件,现在比较流行的为XSL文件。
二、解析XML的方法
使用C++解析XML的最大好处是速度快,特别是大量数据时。
XML不像html有固定的标记,没有固定的解析器如IE或Netscape可以解析XML真正含义。 我们需要自己编写一段程序做这样的事情。
就像我们可以用ODBC/ADO读取数据库一样,我们可以用SAX/DOM解析XML文件。
三、SAX vs DOM
SAX是基于事件驱动的, 通过判断每一行数据的类型(节点/元素/其他)而决定如何处理。DOM则对XML文件整体产生一个树状结构,很显然DOM更实用一些,因为可随时读取文档任意节点数据,但其对内存要求大一些。SAX会快一些,因为解析时只保存当前行的信息。不管用那种方法解析出的数据都需要我们决定其用途,例如一个含图形数据XML,就需要调用GDI函数根据解析出来的数据画图。
SAX简介:
startDocument(); //打开XML文档;
startElementz();
//处理XML数据;
endElement();
endDocument(); //关闭XML文档;
例子:
假设XML文件,
<?xml version="1.0"?>
<parts>
<part>TurboWidget</part>
</parts>
SAX处理分析过程;
StartDocument( )
StartElement( "parts" )
StartElement( "part" )
Characters( "TurboWidget" )
EndElement( "part" )
EndElement( "parts" )
EndDocument( )
DOM简介:
例子:
IXMLDOMDocument* pDoc;//XML文档Object;
CoCreateInstance(CLSID_DOMDocument, NULL, CLSCTX_INPROC_SERVER,
IID_IXMLDOMDocument, (void**)&pDoc);
XMLDOMNode * pNode;//XML节点Object;
pDoc-QueryInterface(IID_IXMLDOMNode,(void**)(&pNode));
数据处理(可以是递归函数):
GetChildItem(); //获得子节点
节点处理:
get_nodeName();//节点名
get_nodeTypeString();//节点含数据
get_nodeType();//节点类型
四、最后提供一个DOM程序例子,该例子仅仅能生成XML的树状图,没有更多处理。 更多内容将在以后发布。
五、希望能给大家帮助,欢迎大家批评指正,具体请看源代码。使用开发包为MSXML3,当然用Apache Xerces原理也是一样的。