深入了解C语言
这一节我们主要来研究一下C语言如何使用函数中的局部变量的.C语言中对于全局变量和局部变量所分配的空间地址是不一样的.全局变量是放在_DATA段,也就是除开_TEXT代码段的另一块集中的内存空间.而局部变量主要是使用堆栈的内存空间.好了,让我们直接看看下面这个案例研究.
研究案例三
工具: Turboc C v2.0,Debug,MASM v5.0,NASM
实例C程序:
/* example3.c */
char ch;
int e_main()
{
int i1;
int i2;
int i3;
i1=1;
i2=2;
i3=3;
}
; C程序的入口 start.asm
[BITS 16]
[global start]
[extern _e_main]
start:
call _e_main
目标内容:C语言使用局部变量的方法
同样,这里我需要使用start.asm来作为我们C语言的入口.我们使用e_main,避开常规main函数入口,这样我们就能更清晰地了解到函数内部所产生的代码指令.
跟前一节一样,我们先编译C程序和入口汇编程序start.asm
nasmw -f obj -o start.obj start.asm
TCC -mt -oexample3.obj -c example3.c
link start.obj example3.obj,example3.exe,,,
exe2bin example3.exe
同样,我们使用老DOS的DEBUG工具来对example3.bin进行反汇编查看C生成的代码.
DEBUG
-n example3.bin
-l 0
-u 0
xxxx:0000 CALL 0003
xxxx:0003 PUSH BP
xxxx:0004 MOV BP,SP
xxxx:0006 SUB SP,+06
xxxx:0009 MOV WORD PTR [BP-06],0001
xxxx:000E MOV WORD PTR [BP-04],0002
xxxx:0014 MOV WORD PTR [BP-02],0003
xxxx:0019 MOV SP,BP
xxxx:001B POP BP
xxxx:001C RET
好了,这里关于C生成的代码已经显露出来了.除开第一句CALL 0003是我们在start.asm的代码外,其它就是我C程序生成的代码.
首先进入e_main函数.执行
PUSH BP
MOV BP,SP
这跟我们前面第二个案例中函数反问参数的代码相同.先保存BP,然后把堆栈指针传递给BP,以便后面通过BP来实现对变量的访问.
SUB SP,+06
将堆栈指针继续后移动6个字节.因为我们在e_main中定义三个整型变量i1,i2,i3,一共6个字节的空间.这里通过移动堆栈指针,来实现局部变量的内存空间分配.
MOV WORD PTR [BP-06],0001
MOV WORD PTR [BP-04],0002
MOV WORD PTR [BP-02],0003
分别对应我们在e_main中的三条赋值语句
i1=1;
i2=2;
i3=3;
这里我们可以看出,i1的地址实际上就是BP-06,i2就是BP-04,i3就是BP-02.前面的SUB SP,+06就是为了这三个变量而留出6个字节的空间(BP-08到BP-02)
同时我们也看到C语言中16位的赋值语句就是简单的MOV指令完成的.
MOV SP,BP
当e_main函数结束后,堆栈指针还原成BP(BP值从未改变过).这样,我们的局部变量i1,i2,i3的空间也就消失了.所以当C语言中的函数结束后,函数中的局部变量会自动消失.
POP BP
还原BP的值.这与前面的PUSH BP想对应
好了,本案例研究完毕.下面是总结的时候了.
C语言函数中的局部变量的空间一般都是放在堆栈里面.在进入函数前,通过"SUB SP,+XX"来为这些局部变量分配堆栈空间.然后同样通过BP来对这些局部变量进行访问.函数结束时,"MOV SP,BP"还原堆栈指针,局部变量随之而消失.最后以"POP BP"还原BP,结束该函数.
值得注意的是,C语言会自动为C函数中经常使用int类型变量设置成resigter int.这样的局部变量就不是使用堆栈空间的了,而就是直接使用SI寄存器.
比如一个典型的例子
void loop()
{
int i;
while(i<10000)
{
i++;
}
}
对于这样的函数,C语言通常会将i优化成resigter int i.这个i没有使用任何内存空间来保存数值,它的数值直接保存于SI寄存器.那么对它的访问速度自然比起一般的变量要快.