我首先来说说XML、XSL的语法(以下皆是本人在学校学习时候做的笔记)如有错误请高手休正
词法特征:
XML区分大小写,如元素名在打开和关闭标记中应保持大小写一致<mytag>…</mytag>,XML的保留词串应符合大小写要求<?xml …> <!ENTITY>…。
XML保留标记字符为:< > &,保留字符不允许出现在元素名、元素文本、属性名、属性值中,< 用户打开标记,>用于关闭标记,&用于转意,常见的转意为 <生成<,>生成>,&生成&,&apos生成’,"生成”
元素名以下划线或字母开始,可包含字母、数字、句点、连字符、下划线、冒号和用于其他语言的扩展字符,元素名中不能有空格符(分格符、跳格符、换行符、回车符),元素名可以由名域前缀。如:<mytag> <dt:mytag> 元素文本可以是除XML保留字符外的字符集合,如<mytag> my money is $2000 </mytag>
属性名的规则同元素名,属性值由单引号或双引号括约其中,可由除XML保留字符以外的字符串组成,如:<mytag myprop=”proper value”>。属性名有xmlns前缀,表明该属性定义了一个名域,如:<mytag xmlns:ns=”" target=_blankhttp://www.myweb.com/myschema”>
句法特征:XML文档由一个XML说明、多个可选的文档说明、多个可选的XML指令、多个可选的XML注释和一个根元素的数据体组成,此外还可以有嵌入语句中的CDATA段,如:
<?xml …?> /*XML说明*/
<!DOCTYPE …> /*XML文档说明*/
<!-- … --> /*XML注释*/
<?xml-stylesheet …?> /*XML指令*/
<root> /*根数据元素*/
<child>
…<![CDATA[…]]>
</child>
</root>
XML说明由<?xml打开,由?>标关闭,其中包含版本、编码等可选说明,如:<?xml version=”1.0” encoding=”UTF-9”?>
XML文档说明由<!和保留串打开,由>关闭,如:<!DOCTYPE mydoc SYSTEM “mydoc.dtd”>
XML指令由<?和保留串打开,由?>关闭,如:<?xml-stylesheet type=”text/xsl” href=”mystyle.xsl”?>
XML注释由<!――打开,由――>关闭,如:<!-- this is my xml document -->
XML元素由<元素名>打开,由/>,或</元素名>关闭,元素的打开和关闭标记相互匹配,如<myteg ../>或<mytag>…</myteg>,XML的元素允许嵌套,应此还应保持层次上的匹配,如<myteg><subtag>..</subtag></mytag>。
CDTATA段由<![CDATA[>打开,由]]>关闭,用于使居于其中的语句规避XML解析规则。如:<![CDATA[ select * from mytable where thefield <= ‘100’ ]]>
来看个实例吧:
<?xml version="1.0" encoding="GB2312"?>
<学生>
<编号>001</编号>
<姓名>张三</姓名>
<性别>男</性别>
<年龄>20</年龄>
</学生>
XML的声明(declaration),语句如下:
<?xml version="1.0" encoding="GB2312"?>
1.声明语句<?xml ... ?>的作用是告诉浏览器或其它处理程序这个文档是XML文档。
声明语句中的version表示文档遵守的XML规范的版本。
encoding表示文档所用的语言编码,这个例子用的编码是“GB2312”。
2.注意大小写的区分
HTML中对大小写的区分不是很敏感,但XML对大小写要求非常严格,如果开始的标识是大写,那么结束的标识也一定是大写。
3.“有始有终”所有的标识必须有相应的结束标识
熟悉HTML的人都知道HTML中有很多类似<p>,<tr>,<td>等标识的结束标识是可有可无的,但XML中是不允许这种情况存在。
4.空标识(empty element)必须被关闭
<br>,<img src="http://www.pconline.com.cn/images/pconlinelogo.gif">等单标识,我们该如何处理?
XML增加了/来结束空标识
<标识/>
<标识 属性名="属性值"/>
5.给属性值加引号
HTML中的属性值可以加"",也可以不加"",还可以加''。但在XML中,属性值一定要加""。
6.标识之间不可以交叉 <学生>
<编号>001</编号>
<姓名>张三</姓名>
</学生>
如果写成了
<学生>
<编号>001
<姓名>
</编号>
张三</姓名>
</学生>
是万万不可以的。
以上六点,对于写惯了HTML的人来说,要多多注意呀,千万别按照已有的习惯来写XML,不然就时时会出错。