在Java 中,存储字符的数据类型是char 。但是,C/C++ 程序员要注重:Java 的char与C 或C++ 中的char不同。在C/C++ 中,char的宽是8位整数。但Java 的情况不同。Java 使用Unicode 码代表字符。Unicode 定义的国际化的字符集能表示迄今为止人类语言的所有字符集。它是几十个字符集的统一,例如拉丁文,希腊语,阿拉伯语,古代斯拉夫语,希伯来语,日文片假名,匈牙利语等等,因此它要求16位。这样,Java 中的char 类型是16位,其范围是0~65,536,没有负数的char 。人们熟知的标准字符集ASCII 码的范围仍然是0~127 ,扩展的8位字符集ISO-Latin-1 的范围是0~255。既然Java 被设计为答应其开发的applet (小应用程序)在世界范围内使用,因此使用Unicode 码代表字符是说得通的。当然,Unicode 的使用对于英语、德语、西班牙语或法语的语言是有点低效,因为它们的字符能轻易地被包含在8位以内。但是为了全球的可移植性,这一点代价是必须的。
注重:有关Unicode 码的更多信息可在网址http://www.unicode.org 上找到。
下面的程序示范了char 变量:
// Demonstrate char data type.class CharDemo {public static void main(String args[]) { char ch1,ch2;
ch1 = 88; // code for X
ch2 = 'Y';
System.out.print("ch1 and ch2:");System.out.println(ch1 + " " + ch2);
}
}
该程序的输出结果如下:ch1 and ch2:X Y
注重变量ch1 被赋值88,它是ASCII 码(Unicode 码也一样)用来代表字母X的值。前面已提到,ASCII 字符集占用了Unicode 字符集的前127个值。因此以前你使用过的一些字符技巧在Java 中同样适用。
尽管char 不是整数,但在许多情况中你可以对它们进行运算操作就似乎他们是整数一样。这答应你可以将2个字符相加,或对一个字符变量值进行增量操作。例如,考虑下面的程序:
// char variables behave like integers.
class CharDemo2 {
public static void main(String args[]) {
char ch1;
ch1 = 'X';
System.out.println("ch1 contains " + ch1);
ch1++; // increment ch1
System.out.println("ch1 is now " + ch1);
}
}
这个程序的输出结果如下所示:
ch1 contains X
ch1 is now Y
在该程序中,ch1首先被赋值为X。然后变量ch1递增(自增量1)。结果是ch1 变成了代表Y,即在ASCII (以及 Unicode )字符集中的下一个字符。