此篇文章摘取于即将登载于《Dr.Dobb's 软件研发》第四期(2003年11月)的《The New C:C99中的整型Part 1》,在得到作者Randy Meyers以及《Dr.Dobb's 软件研发》杂志负责人刘江先生的应允下,把全文的前面的一部分作为文档发表,希望能对大家有所帮助。
The New C: C99中的整型 Part 1
译注:这篇文章是The New C专题的第三篇文章,连同下期的第四篇作者Randy Meyers主要讲叙了C99中整型的变化以及新标准。整型(int)做为C语言中的基本数据类型,对C程序员来说其地位无可替代。本文给出了在新的C语言中关于整型的权威诠释,希望能给关心C语言和使用C语言的用户带来帮助。关于本文的一切可以用amstrongest@hotmail.com与译者联系和讨论。
C语言起源于一些非类型语言(typeless languages),但比起那些简陋的非类型语言来说,它却有更多的内涵。
回到八十年代(1980s),那时ANSI C标准和定义函数原型的功能都未出台,在comp.lang.c新闻组上偶尔会发生一些关于C语言类型系统的激烈论战。起因一般都是Pascal的支持者指责C语言缺少严格的类型检查。超越纯粹的反对观点,C阵营有时还会有失公允的一棒子打死所有类型检查的作用。其中一位就曾经这样留言:“C语言不需要强类型,因为C程序员只使用三种类型:整型,字符和字符指针。”
这个夸张的说法本身有些幽默,但就其所说却多少反映了一些真实的情况。在许多C语言程序设计中,尤其是系统编程,不同尺度的整型就是基本的数据类型。当然,你也可以用数组和结构来存储整型。有时候整型代表数字,而有时候他们却代表字符,但几乎所有的东西都是整型或者其演化中的一种。SNOBOL语言的基本数据类型是string, FORTRAN的是浮点成员(floating-point number),但对C来说,那就是整型。
这并不是在说C99中没有新的而且重要的浮点特性,因为这样的新特性确实存在。然而,对于大多数C程序员来说,整型依旧是核心。在这个月和下个月的专栏中,我将叙说在C99中关于整型的新特性。
不再是默认类型
C是从非类型语言BCPL和B中演化而来的,其本身在发展初期的短暂时期内也同样是非类型语言。非类型语言并非真的完全没有类型,更精确的说应该是它们只有一种类型----机器字(machine word),但在其上的大多数操作都把它当作整型来对待。毫无疑问,在那些语言中的声明是不需要包含类型说明符的(type specifier),因为在那些语言中只有一种(但没有类型的名字)类型是有效的。当Dennis Ritchie第一次把类型加到C语言中的时候,被加入的仅仅是整型和字符。我不知道这样的行为是否是在认同C语言的根基是非类型语言,或者整型在C语言中的威望就由此而来,也或者这同时就是C语言著名的简洁性的来由。无论如何,C语言从其源头开始一直到C99定案前,整型就一直是语言的默认数据类型。如果你声明一个对象或者函数而没有指定其类型,亦或者通过调用隐式的声明了一个函数,这些默认的类型都将会是整型。
举例子来说,在C99之前,如果下面的代码属于一个翻译单元:
extern x;
f(y)
{
register z = g(x) + y;
return z;
}
变量X,Y,Z的类型都将是整型,并且函数f和g也都返回整型。C99要求在任何时候如果运用到早期C语言定义的属性-----一个类型采用整型作为其默认值的话,编译器都要给出一个诊断。给出诊断的好处是因为很多隐式整型都会带来错误而且这样的错误不易定位。就象下面这样的完整翻译单元:
int main()
{
double d;
d = sqrt(2.0);
return 0;
}
因为sqrt是隐式声明的,编译器将让其返回一个整型。当sqrt 正确的存储其double型返回值时,主函数main并不需要知道返回值存储在哪个位置(在一些机器上,整型变量和浮点变量使用不同的寄存器),当主函数main加载这个返回值时(从可能错误的地方),为了能把它赋给d主函数将把这个值从整型转换成double型。因为返回值本身就已经是double型了(假设主函数main正确的找到了它),这将造成sqrt返回结果的彻底混乱。
很多种情况下都可能导致这种性质的错误。比如,你可能包含了错误的头文件并且遗漏了必须的函数声明,或者在声明一个外部变量的时候忘记使用类型说明符了。隐式整型特性在带来方便同时也将会带来查找隐晦错误的巨大困难。即使是Ritchie本人也提到他喜欢使用强制函数原型声明的编译器。
注意,C99并不要求编译器把隐式整型诊断看成错误而终止编译。一个聪明的编译器将仅仅把诊断看成是一个警告,并且根据程序员的选择看是给出一个错误的消息或者是完全忽略掉。
-完-