分享

当前位置: 王朝网络 >> 知道 >> 计算机到底能识别多少汉字？

计算机到底能识别多少汉字？

王朝知道·作者佚名 2009-08-11

窄屏简体版字體: 小|中|大|超大

分類: 電腦/網絡 >> 電腦常識

問題描述:

很多冷僻字都打不出来

请问，计算机到底能识别多少汉字？

參考答案:

80年代开始,个人计算机大量在中国使用,国家规定了G

B2312的标准,在CCDOS上开始使用.GB2312在字形上是采用的中国国家颁布的汉字字形,全部

是有拼音的,但是在编码上,为了保证计算机上的使用,采用的是ISO2022的编码法则.对于当

时,不同的国家,只有标准字符集和标准符号集在ISO2022中,不同国家的编码区域是完全一

样的,但是在各自的文字区域是复用的,即,如果安装了GB2312就无法兼容安装日本的标准编

码.在80年代末期和90年代初期,海峡两岸的交流越来越多,却出现了在计算机上文字互补兼

容的问题,在90年代初期,制定了一个GBK的规范,就是在大陆的6763字后面,增加BIG5里面的

15000汉字的部分.这个部分是字型与台湾的字型是一样的,但是编码仍然是ISO2022.同时8

0年代末期,国际上已经开始重视文化在计算机上的交流,提出了国际统一码的概念,就是在

一个编码体系里面容下全世界的文字.针对这个倡议,世界各国组织了 Unicode委员会,同时

也制定了一个新的编码标准,就是ISO10646编码.由于90年代初期,认识的局限性,中国没有

积极的参与这个活动,日本, 韩国在第一个标准里面占据了大量的码位,后来成立了Super

C.J.K小组进行协调,在这个标准里面,把大陆,台湾的字型都放在里面的话由中国人占据的

码位是20902个,含了所有的GB2312,GBK, BIG5的字型字.90年代末期,中国政府在此基础上

,对于部分字型进行了处理和规范,形成了GB13000.1的标准文件,字型略有不同,但是编码是

采用ISO10646的编码体系.目前在大陆的微软系统用字是ISO10646的20902个汉.Unicode

和ISO10646在初期的理论基础是不同的,Unicode认为字符编码应该是变长的,而ISO10646

认为字符编码是定长的,并且用2字节码就可以把世界上所有的文字解决完.UTF- 8,UTF-16

,UTF32就是在Unicode的理论上形成的计算机信息格式编码.在ISO10646的前面几个版本,是

可以用USC2,和UTF- 8进行处理的.但是,在90年代末期,中国向Unicode委员会又提交了6千

多个汉字,ISO10646的编码体系最大只能放65536个字符,无法满足东亚语言新提交的字符要

求,所以ISO10646从3.0开始进行扩充,在原有编码基础上,对于还未用满的区域进行了扩充

,拓展了一部分到4字节,这样 ISO10646的编码空间从65536到了150万字符的容量.所以在后

来的ISO10646标准都是采用了变长码的原则,完全与Unicode重合了.这样Unicode和ISO106

46变成了等同的关系,目前已经到4.0了,一共有71000汉字.在4.0中一共是3个部分,基本级

20902, 扩充A6千多个,扩充B4万5千多个.回过来,在中国进行WTO谈判时,某些政府官员自己

认为要反对文化入侵,对于外国进入中国的信息系统进行限制,在仓促之间推出了GB18030-

2000,这个标准在ISO10646的基本集的20902字是用ISO2022进行编码的,对于扩充A的字是采

用的四字节码.但是在计算机实现上,不能ISO2022和ISO10646混用,如何解决了?微软就在表

现层是GB18030-2000的,在底层是 ISO10646的,用UTF-8处理.所有的多国语言问题都是这样

处理啦.目前在Unix和Linux的处理是,把6千多个4字节变换成2字节,在表现层和底层都用I

SO2022的标准.新的Linux的内核和X-Windows都支持Unicode的,所以,我们计划在新的计划

中,变成和微软一样的处理方法,使得底层是统一编码的,表现层是可以多编码转换的关系.

因为扩充B的4万5千多字无法转换成2字节编码啦(65536限制),所以今年将发布的 GB18030

-2003的新的和扩充B等同的部分使得Linux和Unix将付出新的代价.建议FreeBSD处理时最好

采用和微软公司一样的方法.一次解决后,只需做翻译码表,而不需要动底层了.当时我是国

家图书馆的总工程师向信息产业部质疑为什么GB18030-2000是强制性的,如何解决多国语言

问题?如何参加国际交流?现在教育部语言文字委员会开始研究ISO10646/Unicode/GB13000

的问题,因为康熙字典有52000字,大约有4000多个在V4.0中,中华大字典

点击展开全文

小贴士：① 若网友所发内容与教科书相悖，请以教科书为准；② 若网友所发内容与科学常识、官方权威机构相悖，请以后者为准；③ 若网友所发内容不正确或者违背公序良俗，右下举报/纠错。

上一篇：武林外传，魔兽争霸3，跑跑卡丁车。各有多少人玩？

下一篇：外国人经常说的“lol”是什么意思？

免责声明：本文为网络用户发布，其观点仅代表作者个人观点，与本站无关，本站仅提供信息存储服务。文中陈述内容未经本站证实，其真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

没有找到您想要的？点此查看更多相关文章
相关文章▶

2023年上半年GDP全球前十五强
百态 2023-10-24

美众议院议长启动对拜登的弹劾调查
百态 2023-09-13

上海、济南、武汉等多地出现不明坠落物
探索 2023-09-06

印度或要将国名改为“巴拉特”
百态 2023-09-06

男子为女友送行，买票不登机被捕
百态 2023-08-20

手机地震预警功能怎么开？
干货 2023-08-06

女子4年卖2套房花700多万做美容：不但没变美脸，面部还出现变形
百态 2023-08-04

住户一楼被水淹还冲来8头猪
百态 2023-07-31

女子体内爬出大量瓜子状活虫
百态 2023-07-25

地球连续35年收到神秘规律性信号，网友：不要回答！
探索 2023-07-21

全球镓价格本周大涨27%
探索 2023-07-09

钱都流向了那些不缺钱的人，苦都留给了能吃苦的人
探索 2023-07-02

倩女手游刀客魅者强控制（强混乱强眩晕强睡眠）和对应控制抗性的关系
百态 2020-08-20

美国5月9日最新疫情：美国确诊人数突破131万
百态 2020-05-09

荷兰政府宣布将集体辞职
干货 2020-04-30

倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观：鹏程万里
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案神机营：射石饮羽
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山：拔刀相助
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案天工阁：鬼斧神工
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道：单枪匹马
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野：与虎谋皮
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野：李代桃僵
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野：指鹿为马
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案金陵：小鸟依人
干货 2019-11-12

倩女幽魂手游师徒任务情义春秋猜成语答案金陵：千金买邻
干货 2019-11-12

推荐阅读

关注内容

>>返回首頁<<

靜靜地坐在廢墟上，四周的荒凉一望無際，忽然覺得，淒涼也很美

© 2005- 王朝網路版權所有