1、Html
无论是独立的html,还是其他程序生成的,如Servlet等,注重在最终的html的和之间必须加入meta标签,用来指定html中输入字符的编码,如:
<head> <meta http-equiv="Content-Type" content="text/html; charset=gb2312"> <title>测试GET && POST-Send</title> </head>
2、jsp和servlet
首先必须解决程序输出(如response.writeln(String s))和接受从客户端传来的数据(如request.getParameter(String sname))编码问题,我们可以利用文件过滤功能,具体需要所用的jsp/servlet容器或者服务器提供的功能设置,如在Tomcat5.5.9中可以在webapps/yourAppDirectory/WEB-INF/web.XML中设置如下:
<filter> <filter-name>SetCharsetEncodingFilter</filter-name> <display-name>SetCharsetEncodingFilter</display-name> <description>Set CharsetEncoding Filter</description> <filter-class>com.gg.comm.web.SetCharsetEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>gb2312</param-value> </init-param> </filter> <filter-mapping> <filter-name>SetCharsetEncodingFilter</filter-name> <url-pattern>/*</url-pattern> </filter-mapping>
其中SetCharsetEncodingFilter Class就是用来设置request和reponse字符编码的filter类,其中设置语句如下:
request.setCharacterEncoding(targetEncoding); response.setContentType("text/html"); response.setCharacterEncoding(targetEncoding);
另外为了解决通过get(url中带有参数)方式传递参数的乱码问题,我们还需要设置一下url传递参数所需要的编码,具体在Tomcat5.5.9中可以在${Tomcat_home}\conf\server.xml中的和之间设置,如下:
<!-- URIEncoding="GBK":Force GET method String(Chinese) can be transferd properly by http:uri note:Tomcat only support GBK specification,so not set charset gb2312 --> <Connector URIEncoding="GBK" port="80" redirectPort="8443"maxSpareThreads="75" maxThreads="150" minSpareThreads="25"> </Connector>
最后为了解决jsp的乱码问题,我们还需要作如下处理,即在左右的jsp头均加上如下指令:
<%@ page contentType="text/html;charset=gb2312" language="Java"%> 或者 <%@ page pageEncoding="gb2312"%>
3、JDBC和数据库
关于写入数据库和读取数据库数据的乱码问题,可以通过如下方式轻松解决:
对于JAVA程序的处理方法按我们指定的方法处理。
把数据库默认支持的编码格式改为GBK或GB2312的。
到此,一般来说对于WEB方式的应用来说,中文问题就可以解决了。当然以上方法是根据统一编码的原则解决的以及WEB方式的文件转换关系(file->class->load->execute or transfered or response or request)来做的。