要妥善解决mysql中文存取乱码问题,主要与mysql以及jdbc driver,jsp页面的编码等有关,今天早上dubug了一下mysql jdbc driver,对mysql和jdbc driver(3.0.9-stable)有了一些了解,整理如下
a) mysql4.0所有的数据均以一种编码ISO8859_1存储
jdbc driver在取出数据后,将会进行编码,由于原数据都是ISO8859_1编码,因此jdbc会采用url里面指定的character set来进行编码,resultSet.getString(*)取出的就是编码后的字符串
b) mysql4.1支持column level的character set,每个table,column都可以指定编码,不指定就是ISO8895_1,因此jdbc取出数据后会根据column的character set来进行编码
因此,当4.0升级到4.1的时候,会遇到乱码问题,由于原来的数据都是ISO8895_1编码,而jdbc driver在mysql4.0时取出时会根据url指定的character set编码,而升级到4.1的话,column character set是ISO8895_1编码,取出时也会照ISO8895_1编码,因此就会变成乱码,这个时候有2个办法,1)修改数据表,将存储中文的字段改为gb,big5或者utf8之类, 2)修改jdbc driver令url里面的characterEncoding生效