操作系统在启动之初,或检测到内部错误时,就需要向控制台输出有关信息。可以想象,这在操作系统中是潜在的常用过程。无论是UNIX,还是Linux,作为操作系统的内核部分,都尤其注意了程序的执行效率。我们所选的过程,它们的魅力,都可以用“清丽”之词言之;清丽之意,乃介乎天生丽质,韵味内涵皆清晰可观。我们细致的来看它们魅力与异同。
Ⅰ. UNIX部分(printf)
在UNIX中,是文件prf.c里的过程printf来完成这项工作的。它调用了其他一些过程,程序如下:
/*UNIX 6 --- prf.c
*我们所选的过程为printf和printn。可对应于莱昂氏原2340至2378行的程序部分。
*/
001 printf(fmt,x1,x2,x3,x4,x5,x6,x7,x8,x9,xa,xb,xc)
002 char fmt[];
003 {
004 register char *s;
005 register *adx, c;
006
007 adx = &x1;
008 loop:
009 while((c = *fmt++) != '%') {
010 if(c == '\0')
011 return;
012 putchar(c);
013 }
014 c = *fmt++;
015 if(c == 'd' || c == 'l' || c == 'o')
016 printn(*adx,c=='o'? 8: 10);
017 if(c == 's') {
018 s = *adx;
019 while(c = *s++)
020 putchar(c);
021 }
022 adx++;
023 goto loop;
024 }
025 /*-------------------------- */
026
027 printn(n, b)
028 {
029 register a;
030
031 if(a = ldiv(n, b))
032 printn(a, b);
033 putchar(lrem(n, b) + '0');
034 }
035 /*-------------------------- */
036
037 /* putchar(c); */
038
对程序做简单说明。首先您注意到,这里c语言是旧时的风格,由printf的参数fmt可看出。还有就是,过程putchar涉及硬件相关的知识,同样,过程ldiv和lrem是汇编语言的过程,我们为简略起见,不再分析相关代码,而只提供如下提示:
对于printn,假设 n = A*b+B,则其中
l A=ldiv(n,b),而且
l B=lrem(n,b),0<=B<b。
过程printf是一种简单而直接的方法,可以方便的向系统控制台终端发送消息。并无缓存,也没有消息的优先级,后面可以看到这和我们所选的Linux的那个过程是不一样的。而且,printf和putchar都在核心态下运行,类似但不同于由C程序调用库函数“printf”和“putchar”,后者其实是在用户态下运行的。
现在您可以回过头去,试着品味一下这段代码。
我们先看过程printf。
007 007 寄存器变量adx记录了第一个参数x1的地址,注意x1占用的是栈单元,编译时不能对此表达
式求值。从008到023,则是一个大循环,关乎我们的全部工作。
009 009 至 013 一个while循环,消息字符串在fmt内,而这里,边输出消息,边检测可有
“%d”、“%l”、“%o”或“%s”出现,分别表明后面的参数里有十进制数、八进制数或字
符串内容需要输出。如果遇到结束符,则返回。
014 014 可以和009里相同的部分对照看。C语言的简练,竟可至此。当在009里,若寄存器变量c取出
字符‘%’时,其后fmt会后移一位,转到014执行。而这里是先取fmt内容,然后后移,则
c可为‘d’、‘l’、‘o’或‘s’了。若fmt中无‘%’出现,则整个字符串被送出后过程
就立刻返回,没有执行014及其后程序的可能,也就没有fmt超界的险情。这是逻辑力量的魅
力。
015 与 016 调用了递归过程printn。后面详细叙述。
017 017 至 021 处理字符串s。整个过程比较清晰,看上去也极易明白。
022 022 adx后移一位。最初adx存储的是谁的地址?第一个参数x1的。后移一位指向哪里?再仔细
一看,其它参数如x2、x3等皆未在程序中用到。您是否有些糊涂了?
C语言程序设计在过程调用和过程说明时,两者之间的参数不进行匹配检查。参数皆按逆序放到栈上,如图:
之所以如此,是因为这个版本的UNIX运行的机器PDP11中栈向下生长,也就是向低地址方向扩展。所以“x1”的地址高于“fmt”,但低于“x2”,其他类推。
这样,adx自增1,其实指向了下一个参数。
023 goto 语句,回至loop处。
下面看printn过程。由提示,您或许能分析出,该过程将一个二进制数按第二个参数b所表示的基数转换成一组数字字符。这里设计了一个小小的算法。
031 和 032 这个递归调用是算法的主题部分。若n = a*b+c,而递归调用,就是
“a(m)=a(m+1)*b+c(m),0<=c(m)<b,
a(0)=n,至a(m+1)==0时开始返回“
的计算过程。
033 033 依次返回,输出数字字符c(m),…,c(0)。数字的算术值,加‘0’可方便的得到对应
的字符值。
这个算法本身较好,又部分采用了汇编代码实现,效率很高了。可是,UNIX的哲学是“尽量使其简化”,使用递归调用使得算法不太明朗,而且于效率也略有损害。不做跟踪,您能明白033行 lrem的第一个参数传n,为什么又输出的是c(m),…,c(0) 吗?如果稍做更改,可能会更好。读者可以尝试。
但这也是白玉微瑕,现在再回头看整个程序,可有新的收获?