汉字获得拼音(包括多音)得到拼音首字符.查询.排序等的实现
//**************************************************
步骤:
//得到拼音(包括多音)
A: 用输入法生成器(win2000)"C:\Program Files\Windows NT\Accessories\Imegen.exe"
逆转换拼音输入法文件C:\WINNT\SYSTEM32\WINPY.MB
会生成一个C:\WINNT\SYSTEM32\WINPY.txt文件(简称 WINPY.txt文件)
B: WINPY.txt文件里面是 汉字拼音列表5万多条 除去词组 有汉字2万多个(含多音)
C: 汉字可以转换成某中编码可以自己构造编码方法,保证一个汉字对应一个编码 简称编码方法)
如 byte[] uniCode = new String(temp).getBytes(“GB2312“);
将WINPY.txt里面所有的汉字变成编码。得到汉字编码 拼音对应表(简称汉字编码表)
XXXX0,a //XXXX0是某个汉字的编码
XXYX2,o //XXYX2是某个汉字的编码
D: 汉字编码表按编码排序,编码表按编码大小排序。
编码表分组(方便查询 ) 而且得到分组的标志。
E: 查询汉字拼音 将汉字进行编码(按自己的编码方法)。
用编码在编码表中查询就可以得到拼音,查询时在编码表中的某个分组中查询,而不是在所有编码中查询。速度很快。
//得到首字符 如'北京' 得到 'bj' '呆子'得到 'd[a]z ' //多音
//排序 有了拼音 就可以按一些常见的排序方法排序
//************************************************
//********如果您不想开发,就免费使用我提供的包好了***********
//**********************************************
py.jar 本包免费无限制使用(提供源代码)
pybean里面是能调用的方法 使用里面的方法就可以了
stringall是具体的处理类 未提供注释 代码苦涩 没有必要看。
本包在项目中运行良好 所以放心使用。
使用说明见 help.txt
//**********************************************
py.jar 是一个查询汉语拼音 并按拼音首字快速排序的包(包括多音字) 。
1:能在下拉列表中快速定位中文项。
可以用拼音定位:若(比如输入 'BJ' 就能在指定城市名列表中准确找到'北京',及时响应。600个城市名中查询只要1/40秒)
★2:也可以用其他输入法定位
★3:可以通过汉字查询拼音(包括多音) 也能查询五笔编码(多种)或者其他输入法的编码。
4:主要为软件开发者提供支持。
5:支持大批量查找,输入拼音(首字母)在1秒中内能在两万个中文名字中找到。速度与数据库相当。
★6:分布式系统中,能将查询集中放入一台或者多台服务器中,支持缓冲,即 可以当你第二次做同样的查询或者定位时,服务器 自动给出结果。
7:你的软件用户再也不需要在长长下拉列表中查找;也不需要在多个下拉列表中多次选择(如 先选择‘省’再选择‘城市’);也不需要先输入汉字,再点击‘查询’;
8:提供JAVA版的例子和开发包。你可能使用来开发基于拼音定位的下拉列表框,为你的软件增加易用性,免费使用(可以看源代码),支持20000多个汉字。当前你所看见的下拉框都只支持英文字符排序。
如您想得到更多功能或者技术支持或者获得更多的方案,需要一定费用。
例子: 解压后 javaw -classath "py.jar" test
wmwcpu88@hotmail.com QQ:75137161
//**********************************************
带★的功能未在py,jar中提供
谁能提供免费空间 我传上去