看《O’Reilly Upgrading to PHP 5》的时候,心血来潮,把MYSQL升级到了4.1.11,由于机器上没有什么正式系统,也就没有注意到它字符集的变化。后来就把正式应用的系统也给升级了,升级之后其它系统都没问题,唯独一个MANTIS有了麻烦,打开页面都成了乱码,幸亏有备份可以恢复,在恢复的过程中就发现了MYSQL升级带来的字符集的问题--如果MYSQL用UTF8字符集,MANTIS数据导入之后,页面显示乱码,无奈只得把MYSQL调为GBK字符集。
其实我还是愿意使用UTF8字符集的,因为没有不兼容的麻烦,作为长久保留的数据,日后转换、整理起来比较省事;在与外部进行数据交换的时候,也不存在编码转换的问题。可是我始终不明白,在使用PHP连接MYSQL接收用户输入数据,并存入数据库的时候,如果数据库编码是UTF8,是否要把SQL数据也转换为UTF8?抽空弄个小程序试试,如果真是这样那可就麻烦大了,不过我在DOS下用命令行操作UTF8字符集的MYSQL服务器是没法输入汉字的。
以前使用SYBASE的时候曾经被字符集的问题困扰了很久,因为SYBASE如果字符集用错了,某些汉字根本就无法输入,比如大写的零“○”,所以字符集从iso_1换到cp850,又从cp850换到cp936,中间舍弃了很多历史数据,MYSQL千万不要让我重蹈覆辙。