网站简繁转换解决方案
徐长友
由于历史原因,中国大陆采用GBK内码,而台湾、香港及部分海外华人地区采用的是繁体中文BIG5码。所以很多网站就有同时有简繁体版,最原始的方法是做两套版本的网站,这种方法费时费力不说,还有维护困难,难以保证信息的同步和相互查询,特别对于大网站,就说cctv.com.cn 吧 ,内容这么多,更新量大,不可能用这个原始的方法,所以CCTV好象是购买了不知是哪家的网站简繁通,可以进行实时转换!
在网上看到N多的某某简繁通XX版,其实想想,原理并不是很难!用过代理服务器的朋友一定会想到,如果通过代理服务器将内码转换一下就可以完成这样的网站简繁实时动态转换了!
考虑到现在WEB服务器大多使用Apache,运行了不同的服务器上,如果使用跨平台的JAVA实现当然是最佳的选择!这样可以运行在NT、LINUX、UNIX、SOLARIS等绝大多数常用操作系统。JAVA非常适合编写服务端程序。
通过这种方法,网站只需要拥有一种版本(简体或繁体),当用户访问时,系统将实时转换成返回给客户端浏览器、这种方法不仅对服务器端向客户端发送的数据进行转换,同时也对客户向服务器提交的数据进行转换,原网站的程序和数据库只需处理一种内码,不需改变原有程序和数据库,同时对网站的各种服务(如查询等)都能适合,免去两种内码间信息的同步和其它处理问题,如果原来是简体版的网站,当使用系统时,客户在繁体版下输入繁体字提交表单时,系统将自动转换成简体字交给原来的程序处理,可以双向的进行!
主要解决的问题: 1.实现GB<->Big5内码的转换 2.多线程服务器
通过多线程服务器能ContenType为文本类的内容进行内码转换,当然如果只进行简单的内码转换,效果并不一定很好,因为习惯的原因,很多词的用法有一定差别,如:信息与資訊,字节与位元組......,转换后传给客户端浏览器,就搞定网站简繁通了,我们只处理HTML(包括CGI、JSP、ASP、PHP、JS、CSS等)文本内容,对图片,和其它各类文件(如图片)是没法,当然没什么必要去转换。Java写个多线程服务器这并不会很难!
说了这么多了,我想让你去完成一个网站简繁通我想不会有多大困难吧!