当Internet世界正迅速地把注意力聚焦到XML及其相关技术上时,一个问题产生了:以前用HTML构建的网站将怎么办?对于那些刚刚开始进行信息化建设的企业来说,理所当然地可以采用XML技术来设计网页;但对于那些HTML文件已经非常丰富的传统企业来说,要重新构建网站,不仅耗资巨大,而且拖的时间会很长。那么应该如何处理遗留下来的HTML资料呢?
目前已经出现了一种新的技术——可扩展超文本标记语言(XHTML),它被认为是传统的HTML向XML迁移的理想工具。
■HTML要向XML迁移
HTML是一种简单的标记语言。HTML包含许多专用的标记(tags),而这些标记并不被所有的浏览器所支持。一些用来得到视觉效果的元素,如〈font〉标记,仅仅使得HTML文档体积变大。对于显示屏幕很小的PDA和手机等上网新设备, HTML也不能给予很好的支持。可以说,HTML不适合继续作为标准的页面和信息载体语言。
怎样才能让以前积累下来的HTML文档在新的环境下继续发挥作用呢?向XML的过渡是解决之道。XML文档包含了清晰的文档结构信息,可以为各种需要灵活地输出所需要的格式。XML不是一个简单的类似HTML和WML(无线标记语言)那样的预定义标记语言,而是一个让用户根据不同的数据和文档内容而制定标记的语言标准。用户可以为自己的文档建立比HTML更加准确而适当的标记。
可扩展的样式表语言(XSL)提供了一种从存储的XML文件中输出各种所需的格式的途径。许多基于XSL的产品都能通过选用特定的样式表来从XML文件中输出能在各种浏览器中正确显示的HTML文档,而且同一个XML文档还可以使用其它的样式表,创建出能在无线设备中使用的WML格式的文档。设计者所要做的仅仅是创建这种格式文档的样式表,而对于文档的内容不需进行任何的修改,即“身体”是相同的,但“外套”可以自由地进行选择。
■HTML如何改装成XHTML
传统HTML要向XML迁移,最麻烦的就是不容易把HTML文档的内容和表现形式进行分离。那么怎样才能对HTML文档进行改装呢?一个可选择的方案是采用XHTML。XHTML结合了HTML和XML的优点,由于它和HTML很相似,所以可以很容易地把以前的HTML进行简化和改装,形成新的XHTML文档,实现HTML向XHTML的过渡,这要比直接重新构建XML文档简单得多。
首先,XHTML对大小写标记敏感。在XHTML中定义元素的属性必须使用小写,那些曾经在HTML中用来增强文档可读性的有些技巧都不能用了。例如以前在HTML中定义元素属性时使用大写的字符,而具体的数值使用小写,这样可读性强一些,但是这种技巧在XHTML中就不能使用了。
其次,XHTML严格地要求元素必须以标记开始和标记结束。以前经常能在HTML中使用的先打开标记,然后作用于其它内容的手法,现在也必须加以修改。在XHTML中,所有非空的元素都要求被关闭。以前经常被开发者使用的一个技巧就是在两个段落中使用〈p〉这个标记,而不是严格地按照在每一段的开始使用〈p〉而在结尾使用〈/p〉。另外,所有的XHTML属性都需要使用引号来表示,即〈table border = 2〉这样的语句需要改写成〈table border = “2”〉。
最后要指出的一点是,〈head〉 和〈body〉这样的元素在XHTML中都是必须的,而且〈title〉这个元素必须作为第一个元素放在〈head〉段中。
通过对HTML文档进行了这些改变,原来的HTML文件不仅能在HTML的浏览器上得到正确的显示,而且能用支持XML的软件来进行处理。
■HTML转换工具
如果你的站点仅仅有很少的文档需要进行转换,即使采用手工的方法也能处理;但如果有几年累计下来的HTML文档需要转换,那么就需要寻找一个工具来帮助进行。在这方面有许多商业和免费的工具软件可以使用,它们既可以帮助进行转换而且可以直接编辑形成新型的XHTML格式的文件。
HTML Tidy 是一个很基本但很有用的工具,可以运行在多种平台上。HTML Tidy可以用来清除HTML文件的标记错误(相对XHTML标准而言),并能重新格式化HTML文件,使之有更好的可读性。HTML Tidy已成为一个能把HTML向XHTML转换的多功能工具。
HTML-Kit是一个免费的程序,能在许多平台上运行。它不仅能帮助进行HTML的编辑、格式化输出、合法性检查、预览和发布,而且还能在图形界面上进行HTML向XHTML的转换。在其用户界面上,有一个窗口显示源文件,另一个窗口显示转换后的标记语言结果,还有一个窗口显示出现的错误以及对XHTML进行改进的建议。
■直接向XML标准前进
HTML经过改装后形成新的XHTML文档将不再有浏览和显示的麻烦。但是如果希望其内容能被运用到各个领域,那么可以考虑直接建立XML文档。这就需要在现存的HTML中把内容抽取出来,使得内容和表现形式的标记得到分离。
XspLit是由Percussion Software公司推出的新工具。XspLit让Web开发者能把HTML文档转换成相应的XSL样式表。XspLit能创建一个包含格式定义的XML的DTD(文件类型定义)文件,还能使用静态的内容来创建一个XML样本文档。