分享
 
 
 

Linux 国际化本地化和中文化 (2)

王朝system·作者佚名  2006-11-23
窄屏简体版  字體: |||超大  

3. 输入的国际化

在X窗口系统下输入主要有三种方式:

1. 单此击键输入单字符

2. 两个或多个组合键输入单字符

3. 除键输入外, 还需要转换服务器

其中前两种用于输入西文字符, 比如对于欧洲语言的特殊字符的输入, 通常采用

重映射键盘的方法. 或者使用"加速键"的方法输入, 加速键是键盘 上的特殊键,

按下后不会使光标向后移动.

在Linux下, 使用软件xkeycaps可以把键盘重新映射并且保存整个键盘 在映射后

的对照表, 使用命令xmodmap可以加载映射表.

对于中文输入, 主要使用第三种输入方式. 针对各种语言的综合考虑, X 窗口系

统在输入上定义了下列区域:

1. 预编辑区域(Preedit Area), 用于显示输入的过程, 当用户输入 字符时,

应立即显示在该区域

2. 状态区域(Status Area), 用于显示输入状态, 对中文来说, 用于显示输入

方法, 全角/半角状态, 中文/西文标点符号状态.

3. 辅助区域(Auxiliary Area), 显示可供选择的列表, 又称选择 区域, 它由

输入服务器控制.

根据预编辑区域和状态区域的不同组合, X 窗口系统共定义了四种输入 的风格

(Input Style):

1. Root风格: 预编辑区域和选择区域都在应用软件之外, 它们都是 由输入服

务器完成的, 输入服务器所显示的界面是根窗口的子 窗口. 如类似"中文之

星"的独立的输入条模式.

2. OffTheSpot风格: 预编辑区域和选择区域在应用软件之内, 通常 是在窗口

下方的某个固定区域内. 如XEmacs的缺省输入模式.

3. OverTheSpot风格: 预编辑区域在当前的输入位置, 状态区域 在应用程序的

某一固定区域. 它通常又称为光标跟随模式, 类似 于Windows下的智能ABC

输入方法

4. OnTheSpot风格: 预编辑区域和选择区域都在应用软件之内, 内容是又输入

服务器发送的, 应用程序负责显示.

对中文输入来说, 最好的风格是(3),(4),(1). 对大部分中文输入方法, 必须弹出

辅助区域, 供用户选择, 只有少数的中文输入方法, 如五笔字型, 比较适合(4).

对于状态区域, 中文输入多数选用在Root风格的窗口的某个 位置或使用专用的控

制条. 在MS Windows下比较常用的光标跟随模式, 可以 用(3),(4)来实现. 鉴于

Linux下有的用户把X Window设置成为虚屏模式, 选 择上述的任何一种模式都不

尽满意.

对应用软件来说, 最简单的输入接口是Root风格, 它把显示部分交给 输入服务器

去做. 编写软件时所用的代码量少, 是对软件初步使用国际化 标准的最佳选择.

从方便用户的角度来看, 应用软件, 特别是高层的库函数 应该同时支持四种输入

风格. 令人遗憾的是, 一般软件仅支持两到三种输入 风格. 所以在现在的输入服

务器(IM Server)也很少支持四种风格, 这似乎 成了鸡和蛋的问题.

下面列出几种常用软件和图形库的XIM支持情况:

NetscapeRoot,OffTheSpot,OverTheSpot

Java Root,OnTheSpot

Qt Root,OverTheSpot

gtk+ Root,OverTheSpot

rxvt Root,OffTheSpot,OverTheSpot

中文输入需要客户软件和服务器软件的的密切配合, 它们之间是通过 XIM(X

Input Method)协议来通讯的. 输入服务器首先起动, 在X Server里 注册自己,

服务器的名字也被注册. 当客户程序起动时, 到X Server里查寻 有没有符合自己

locale类型的输入服务器(如果用XMODIFIERS指定服务器名, 则同时用locale和名

字区分). 找到后, 根据输入服务器提供的风格种类 选择一个最适合自己的风格.

然后客户程序为每一个需要输入的窗口都建立 一个自己的标示IC(Input

Context), 里面含有客户程序的信息, 以后的通讯 则一直使用该标示.

下面是直接使用X Lib和服务器联接的过程, 在高层函数库中, 把这一 过程隐藏

了起来:

XIM im;

XIC ic;

...

if( (im = XOpenIM(display, NULL, NULL, NULL)) == NULL ) {

printf("Error : XOpenIM !\n");

exit(0);

}

//指定预编辑的类型等...

if( (ic = XCreateIC(im,

XNInputStyle, XIMPreeditPosition | XIMStatusNothing,

XNClientWindow, window,

NULL)) == NULL ) {

printf("Error : XCreateIC() ! \n");

XCloseIM(im);

exit(0);

}

...

for(;;) {

XNextEvent(display, &event);

//如果输入服务器接收并处理...继续

if (XFilterEvent(&event, None) == True)

continue;

switch(event.type) {

case Expose:

XmbDrawString(...);

case KeyPress:

count = XmbLookupString(ic,

(XKeyPressedEvent *) &event,

string, len, &keysym, &status);

...

}

}

目前使用比较广泛的XIM输入服务器有Chinput(简体中文, 同时支持繁体), xcin

(繁体中文), kinput2(日文) 和 hanIM/ami(韩文).

中文输入服务器Chinput 选择了OverTheSpot风格作为缺省的输入模式, 它与标准

的输入风格略有不同, 即把预编辑区域偏离输入位置, 使输入区 域同时作为状态

区域, 在很大程度满足了用户的输入习惯. 同时它还使用 辅助工具条显示和改变

输入状态. Chinput还解决了同时使用GB和Big5编码 的问题, 被动输入(Passive

Input)问题等. 对于普通用户, 除了使用键盘 输入外, 还可以使用手写识别输入

和语音识别输入方式. 目前的输入架构 基本能够满足它们的要求. 笔者在手写识

别输入方面做了一些尝试, 发 现对绝大部分软件是能够适合被动输入的.

4. 打印的国际化

在X窗口系统下的打印是一个很难解决的问题, 所以到目前为止没有形成 一个统

一的打印标准. 其原因之一就是X窗口系统在设计上把显示和打印完全 分开了.

在Linux最常见的需要打印的文件格式是普通文本文件和PostScript文件. 对于中

文的普通文本文件的打印一般需要先转换为PostScript文件再打印. 对于

PostScript文件, 如果应用软件在生成时含有中文字体信息, 则打印 比较容易实

现, 反之, 则很难实现甚至不可能打印.

目前中文文本文件常用的打印方法通常是,使用gb2ps/bg2ps/cnprint 等 软件

换成PS文件打印, 转换过程使用了中文的点阵字体. 对已经形成的PS 文件的打

印, 如果不包含中文字体, 直接打印就会输出乱码, 通常使用的方法 是将这一类

PS文件过滤一下, 改为使用中文字体, 然后再打印. 如陈向阳先生 的过滤软件

ps2cps可以打印Netscape的存储文件. 这种打印的缺点是有时输出 的PS中汉字字

符串和英文字符串对不齐. 最好的方法是在PostScript一级实现 中文打印, 陈向

阳先生对ghostscript进行了中文化, 可以直接使用TTF轻松打 印Netscape,

Qt/KDE, lyx等软件输出的PS文件. 这种从底层实现打印的方法 也是日文和韩文

所采用的方法.

使用CID(adobe)字体打印的方法也在尝试之中.

总之, 目前的中文打印缺乏统一标准, 应用软件在输出打印PS文件时多数 不考虑

双字节语言的问题, 使打印变得更加复杂化, 所以当前的中文Linux发 布版本多

数不支持中文打印,

5. 客户程序间通讯的国际化

客户程序间通讯(Interclient Communications Conventions, 简称ICCC)是 客户

程序之间共享资源的手段之一. 最常见的应用是文本的拷贝和粘贴和与窗口 管理

器通讯. 但是如果两个应用程序之间所使用的字符集不同, 粘贴就会出现问 题,

甚至粘贴的内容会丢失. 所以客户程序之间必须国际化了的通讯协议.

应用程序和窗口管理器之间的通讯也属于客户程序间通讯.

如果客户程序之间使用的字符集相同, 但是编码不同, 则不会丢失数据, 这时应

该使用复合文本(COMPOUND TEXT)传输. X内部定义了COMPOUND_TEXT 的原子

(Atom)用于传输中英文混和的字符串. 对7字节编码, ASCII或者其它 ISO8859-1

字符集, 客户程序通讯可以不用转换而直接使用XA_STRING原子传输.

四 开发符合国际化标准的软件

在X窗口系统下开发软件, 应尽量符合国际化标准. 它包括, 设置合适 的locale(见前

面讲述的在X下使用locale), 注意选择字符集和字体集, 本地化文本的处理, 输入方法

等等. 这里推荐用户尽量使用在国际化方面 已经比较完善的高层图形库, 如Qt, gtk+,

Java等, 这样可以避免考虑以 上问题. 选择Motif时需要考虑资源的国际化问题和

FontList等.

1. 开发国际化软件

使用已经支持国际化的高层图形库开发支持国际化的软件基本上可以不用 考虑国

际化问题. 特别是输入问题, 在标准的输入区内(单行输入和多行输入), 都可以

自动输入汉字. 在字体处理上, 注意使用字体集. 许多软件需要在资源 文件中指

字体字体集, 所以开发的软件应提供一个缺省支持字体集的资源 文件.

下面所介绍的开发国际化的软件是基于libX11的开发方法. 除了前面所说的 在软

件初始化时调用一些Locale的函数外, 在实际编程时, 还应注意以下问题:

1. 字体载入: 在处理字符串时, 使用FontSet, 而不是Font:

XCreateFontSet() - 建立字体

XFreeFontSet() - 释放字体集内存

XFontsOfFontSet() - 返回XFontStruct和字体

XBaseFontNameListOfFontSet() - 返回字体集的名称

XLocaleOfFontSet() - 返回XFontSet的locale名

XExtentsOfFontSet() - 获得FontSet的最大Extents

2. 计算字符串的屏幕尺寸并画字符串:

Xmb/XwcDrawString() - 只画字型(glyphs)的前景

Xmb/XwcDrawImageString() - 画前景和背景

Xmb/XwcDrawText() - 复杂的间隔和字体

Xmb/XwcTextEscapement() - X 方向像素

Xmb/XwcTextExtents() - 字符串轮廓

3. 客户程序间通讯:

Xmb/wcTextListToTextProperty() - 根据locale的文本转换

Xmb/wcTextPropertyToTextList() - 根据locale的文本转换

XFreeStringList()

Xmb/wcFreeStringList() - 释放StringList

XSetWMProperties() - 设置窗口管理器属性

XSetWMName() - 设置窗口窗口名

XSetWMIconName() - 设置窗口图标名

4. 输入:

XOpenIM()/XCloseIM() - 打开/关闭输入服务器

XDisplayOfIM()/XLocaleOfIM()

XSetIMValues()/XGetIMValues() - 设置/获取输入服务器属性

XCreateIC()/XDestroyIC() - 建立/释放IC

XIMOfIC()

XSetICValues()/XGetICValues() - 设置/获取IC的值

XSetICFocus()/XUnsetICFocus() - 聚焦/取消聚焦

XmbResetIC()/XwcResetIC() - 重设IC

XFilterEvent() - 过滤事件

Xmb/wcLookupString() - 查找字符串

XRegister/UnregisterIMInstantiateCallback() - 注册/取消回调

2. 使非国际化软件国际化

修改已经存在的非国际化软件, 应根据具体情况采用不同的补丁. 需要 注意的是

修改后的软件应与原来的软件兼容, 不会对软件以前在西文和其它 语言的支持造

成影响. L

[1] [2] 下一页

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有