请C#高手看看这段源代码

王朝知道·作者佚名  2012-07-26
窄屏简体版  字體: |||超大  
 
分類: 電腦/網絡 >> 程序設計 >> 其他編程語言
 
問題描述:

static public string getSpell(string cn)

{

#region

byte[] arrCN = Encoding.Default.GetBytes(cn);

if (arrCN.Length > 1)

{

int area = (short)arrCN[0];

int pos = (short)arrCN[1];

int code = (area << 8) + pos;

int[] areacode = { 45217, 45253, 45761, 46318, 46826, 47010, 47297, 47614, 48119, 48119, 49062, 49324, 49896, 50371, 50614, 50622, 50906, 51387, 51446, 52218, 52698, 52698, 52698, 52980, 53689, 54481 };

for (int i = 0; i < 26; i++)

{

int max = 55290;

if (i != 25) max = areacode[i + 1];

if (areacode[i] <= code && code < max)

{

return Encoding.Default.GetString(new byte[] { (byte)(65 + i) });

}

}

return "?";

}

else return cn;

#endregion

这是一段将汉字转为拼音的代码,我有几个地方不明白,请帮着看一下。

1、Encoding.Default.GetBytes(cn);这个能否祥解

2、int code = (area << 8) + pos;这个是什么意思呀

參考答案:

{ 45217, 45253, 45761, 46318, 46826, 47010, 47297, 47614, 48119, 48119, 49062, 49324, 49896, 50371, 50614, 50622, 50906, 51387, 51446, 52218, 52698, 52698, 52698, 52980, 53689, 54481 };

这一串实际上是中文GBK编码码的十进制数值,GBK码是按照首个拼音字母的顺序来排放的,也就是说,这些其实是A,B,C...不同读音的分隔位置。例如45217代表的是“啊”(读音:a)字, 45253代表的是“芭”(读音:ba)字,b字头的第一个字。找到汉字在上面哪个编码区间,就相当于找到了拼音的首字母

Encoding.Default.GetBytes(cn)是用默认的编码方式把字符串的每个byte的值取出放入arrCN数组中。

int code = (area << 8) + pos;相当于把刚才两个独立的字节数据组装成为一个编码。

为什么要把两个字节组装起来?因为中文的编码都是需要两个字节的,实际上,传近来的中文字符串都是以两个字节为一个单位传进来的。

return Encoding.Default.GetString(new byte[] { (byte)(65 + i) });

这个返回该文字的拼音的第一字母而已,因为ascii编码中,65是代表"A"

这个函数实际上是返回汉字的拼音的第一个字母的大写,并且一次只能处理一个汉字

小贴士:① 若网友所发内容与教科书相悖,请以教科书为准;② 若网友所发内容与科学常识、官方权威机构相悖,请以后者为准;③ 若网友所发内容不正确或者违背公序良俗,右下举报/纠错。
 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航