TOMCAT下的JIVE2的中文问题的报告
原文摘自jive论坛用户shyguy的帖子。
翻译者:cherami
XXX 注意 XXX:
所有的结论都是基于一下平台:
Winnt4.0(简体中文版) + Sun JDK1.3 + Tomcat4.0-b7 + jive2.0.1 + mysql3.23.38 + org.gjt.mm.mysql.Driver-2.04
在这样的条件下,安装在TOMCAT下的Jive2.0不能像其他JSP应用那样不做任何修改就可以正确的显示中文。我不敢确定但是几个测试的结果告诉我tomcat核心的编码总是8859_1,无论是否在双字节的操作系统下。当客户端输入一些中文,request.getParameter()请求返回的字符串是8859_1,因此如果你使用System.out.println()将输入打印到控制台,它看上去就像"??x?"。如果你在每个JSP文件的开始加上 <%@ page contentType="text/html;charSet=gb2312" %> 标签,中文就可以正确显示,因为tomcat知道它的内核编码是8859_1而输出到客户端的PrintWriter(它是JSP的输出对象)的编码是gb2312,因此PrintWriter在内部做了令人愤怒的8859_1到gb2312的转换。这就是为什么我们总是添加contentType解决中文问题的原因。
但是不幸的是,当我们通过JDBC从数据库提取字符串的时候事情就不一样了。
看看下面的虚拟的代码:
str=rec.getString(field);
你能告诉我字符串str的编码吗?
答案是: gb2312!!!
(就像mysql jdbc驱动一样,很多包都根据平台返回字符串的编码,例如 SimpleDateFormat 和
JavaMail。)因此,当你将字符串传递到PrintWrite时,愚蠢的PrintWriter将再次使用8859_1-->gb2312的转换。可怜的客户端别无选择的看到丑陋的????。
令我困惑的是:
request.getParameter()的返回字符串的编码是8859_1,因此向控制台打印时它看上去像??x?,但是Jive可以将字符串用gb2312编码存入数据库!!!
例如,在post.jsp里面,在消息创建发生以前,我将中文主题和内容输出到控制台,它看上去是??x?,但是在mysql数据库里面,SELECT * FROM jiveMessage将返回正确的中文!
同时我也发现response.setLocale()对中文输出没有作用。
如何解决呢:
1. 在输出前使用String.getBytes()反向转换gb2312字符串,这是最愚蠢的方法。
2. 在英文平台下运行服务器。
3. 最最最最好的方法是: 使用其他的 java服务器!
对于TOMCAT用户的建议是:
如果你确实想在一个双字节的操作系统(例如简体中文版的Winnt)上运行TOMCAT,你最好:
(1)添加<%@ page contentType="text/html;charSet=gb2312"%>到
\include\brankding\style.jsp 和
\admin\include\global.jsp的第一行(路径是相对TOMCAT的主目录)
(2)反向转换从数据库返回的所有字符串为8859_1编码。这需要修改JIVE核心的所有DBxxxx类,
或者修改JDBC驱动的"result.getString()"进行反向转换,
或者修改TOMCAT内核中的"out"对象进行反向转换。
(3)如果你修改了tomcat内核中的"out对象,在将中文信息传递到jive/index.jsp时你最好使用URLEncode(/dir/URL.jsp?gb2312_msg)。
附:Rexip AppServer 有Record-Breaking Benchmark Results处理Java应用的服务器端中文问题。