五. XML和HTML的区别
XML和HTML都来自于SGML,它们都含有标记,有着相似的语法,HTML和XML的最大区别在于:HTML是一个定型的标记语言,它用固有的标记来描述,显示网页内容。比如< H1>表示首行标题,有固定的尺寸。相对的,XML则没有固定的标记,XML不能描述网页具体的外观,内容,它只是描述内容的数据形式和结构。
这是一个质的区别:网页将数据和显示混在一起,而XML则将数据和显示分开来。
我们看上面的例子,在myfile.htm中,我们只关心页面的显示方式,我们可以设计不同的界面,用不同的方式来排版页面,但数据是储存在myfile.xml中,不需要任何改变。
(如果你是程序员,你会惊讶的发现,这与模块化面向对象编程的思想极其相似!其实网页何尝不是一种程序呢?)
正是这种区别使得XML在网络应用和信息共享上方便,高效,可扩展。所以我们相信,XM做为一种先进的数据处理方法,将使网络跨越到一个新的境界。
六. XML的严格格式
吸取HTML松散格式带来的经验教训,XML一开始就坚持实行"良好的格式"。我们先看HTML的一些语句,这些语句在HTML中随处可见:1.
sample2.< b>< i>sample< /b>< /i>3.< td>sample< /TD>4.< font color=red>samplar< /font>在XML文档中,上述几种语句的语法都是错误的。因为:1.所有的标记都必须要有一个相应的结束标记;2.所有的XML标记都必须合理嵌套;3.所有XML标记都区分大小写;4.所有标记的属性必须用""括起来;所以上列语句在XML中正确的写法是1.
sample2.< b>< i>sample< /i>< /b>3.< td>sample< /td>4.< font color="red">samplar< /font>
另外,XML标记必须遵循下面的命名规则:1.名字中可以包含字母、数字以及其它字母;2.名字不能以数字或"_" (下划线) 开头;3.名字不能以字母 xml (或 XML 或 Xml ..) 开头;4.名字中不能包含空格。
在XML文档中任何的差错,都会得到同一个结果:网页不能被显示。各浏览器开发商已经达成协议,对XML实行严格而挑剔的解析,任何细小的错误都会被报告。你可以将上面的myfile.xml修改一下,比如将< email>改为< Email>,然后用IE5直接打开myfile.xml,会得到一个出错信息页面: