Vb.net进阶:.NET 中的代码页(CodePage)

王朝c#·作者佚名  2006-12-17
窄屏简体版  字體: |||超大  

如果你还在为这种事情烦恼:

那这篇文章对你来说是有用的。

为什么会出现这种事情呢?因为这些乱码本来不属于我们现在所用的代码页(简体中文,GB2312)。

关于代码页的介绍请看MSDN2003中的“代码页的编码支持”。

怎样才能将乱码还原成“本来面目”呢?我们要做的就是将乱码字符串化解为Byte数组,然后用正确的代码页将其重新编码。怎样取得正确的代码页呢?在MSDN中有一张表介绍了个代码页及其相对应的整数值。比如简体中文是936,繁体中文是950,日文是932,朝鲜语是949。

MSDN中的代码页列表是在:

http://msdn.microsoft.com/library/chs/default.asp?url=/library/CHS/act/htm/actml_ref_scpg.asp

这里直接给个例子,说明如何还原乱码:

Private Function ConvertTo(ByVal str As String) As String

Dim ec As System.Text.Encoding = System.Text.Encoding.GetEncoding(CodePage)

Return ec.GetString(System.Text.Encoding.Default.GetBytes(str))

End Function

在这里,str是要转换的乱码,CodePage是一个整数,对应要转换的代码页的数值。这个函数就是返回还原后的乱码的。从ec的定义可以看到它是根据CodePage创建的。红棕色部分是把字符串分解成Byte数组,然后再用ec的GetString方法重新编码。返回的结果就可以直接显示了。怎么样,简单吧?下面是一些效果:

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航