XML声明
<?xml version="1.0" encoding="gb2312" standalone="yes"?>
standalone:文档是否在这一个文件里,还是需要从外部导入文件。
处理指令PI(Processing Instruction)
<? ?>
处理指令用于XML解析器传递信息到应用程序。XML解析器是读取并保存XML文档内容的模块;应用程序是解析器获取文档内容并处理和显示这些内容的独立软件模块;IE同时提供XML解析器和应用程序。
样式表处理指令,这个处理指令必须出现在序言部分,根元素之前。
<?xml-stylesheet type="text/css" href="uri"?>
DOCTYPE
紧随XML声明之后,它包括着所有的实体声明。
<!DOCTYPE 根元素标记名[
<!—实体声明-->
]>
注释<!-- -->
注释内容中不要出现--;注释不能放在标记中间;注释不能嵌套;可以在除标记以外的任何地方放注释。
根元素
每个XML文档必须有且只有一个根元素;根元素是一个完全包括文档中其他所有元素的元素;根元素的开始标记放在其他所有元素的开始标记之前;根元素的结束标记放在其他所有元素的结束标记之后。
文本内容PCDATA
尽管文档中可以出现任何元素,但出现的元素必须声明。
<!ELEMENT YEAR (#PCDATA)>
该声明说明YEAR只能包含可析的字符数据,即非标记文本,但它不能含自己的子元素。
CDATA
大多数情况下,出现在一对<>中的是标记,不在这中的是字符数据。但是有一种情况例外。在CDATA段中的所有文本都是纯字符数据。看起来与标记或者实体相似的仅仅是它们各自相应的文体,XML处理器无论如何是不会解析它们的。
CDATA段用于需要把整段文本解释为纯字符数据而并不是标记的情况。当有一个包含许多< > & 等是字符而非标记的庞大文本时,这是非常有用的。
它以“<![CDATA[”开始并以“]]>”结束,需要注意的是,唯一不许出现在CDATA段中的是CDATA的结果界定符“]]>”。
实体(entities)
实体在XML中是存储单元,一个实体可以包含字符串,文件,数据库记录以及一些其他数据。应用实体主要是为了避免在文档中进行重复输入,我们可以为一个文档安排一个实体名,然后在XML文件中用这个名字代替引入文档,当XML文件解析时,实体名被替换为文档。
<!ENTITY LOGO SYSTEM=“logo,gif”>
<IMAGE SOURCE=“LOGO”/>
还有五个实体代替特殊符号:<=<;>=>;&=&;&qout=”;&apos=’.
XML文档节点类型
文档(document)
元素(element)
属性(attribute)
文本(PCDATA--parsed character data)
注释(comment)
处理指令(PI--processing instruction)
DOCTYPE
实体(ENTITIES)
CDATA(character data)