C编译器对结构空间缺省的分配
在C语言中,结构是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构、联合等等)的数据单元。在结构中,编译器为结构的每个成员按其自然对界(alignment)条件分配空间;各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间,见表1:
表1:Win32下的自然对界条件
例如,下面的结构各成员空间分配情况如图1:
struct test {
char x1;
short x2;
float x3;
char x4;
};
图1:缺省结构空间分配
结构的第一个成员x1,其偏移地址为0,占据了第1个字节。第二个成员x2为short类型,其起始地址必须2字节对界,因此,编译器在x2和x1之间填充了一个空字节。结构的第三个成员x3和第四个成员x4恰好落在其自然对界地址上,在它们前面不需要额外的填充字节。在test结构中,成员x3要求4字节对界,是该结构所有成员中要求的最大对界单元,因而test结构的自然对界条件为4字节,编译器在成员x4后面填充了3个空字节。整个结构所占据空间为12字节。
结构中的位段
所谓位段是以位为单位定义长度的结构体类型中的成员。编译器对结构中位段的分配遵从下面几点原则:
? 对于长度为0的位段,其下一个位段从下一个存储单元开始存放:
如:
struct T {
unsigned char a : 1;
unsigned char b : 2;
unsigned : 0;
unsigned c : 3;
};
结构T的成员a和b在一个存储单元中,c则在另一个存储单元中。
· 一个位段必须存储在同一存储单元中,不能跨两个单元:
如:
struct T {
unsigned char a : 4;
unsigned char b : 6;
};
结构T的成员a在一个存储单元中,b则在另一个存储单元中。
更改C编译器的缺省分配策略
一般地,可以通过下面的两种方法改变缺省的对界条件:
· 使用伪指令#pragma pack ([n])
· 在编译时使用命令行参数
#pragma pack ([n])伪指令允许你选择编译器为数据分配空间所采取的对界策略,见表2:
表2:更改缺省对界条件
在Microsfot Visual C++中,命令行参数/Zp[n]可以改变缺省对界条件;在Borland C++ Builder中,命令行参数-a[n]可以改变缺省对界条件。n的含义和#pragma pack中的n相同。
例如,在使用了#pragma pack (1)伪指令后,test结构各成员的空间分配情况如图2所示:
图2:使用#pragma pack (1)后的结构空间分配
应用实例
我们在日常编程工作中,特别是对一些网络事务的处理,经常会同其他人有着各种各样的协议:如我传给你20字节的头,前4个字节表示……等等。很多人都是通过指针偏移的方法来得到各种信息,这样做,不仅编程复杂,而且一旦协议有变化,程序修改起来也比较麻烦。在了解了编译器对结构空间的分配原则之后,我们完全可以利用这一特性定义自己的协议结构,通过访问结构的成员来获取各种信息。这样做,不仅简化了编程,而且即使协议发生变化,我们也只需修改协议结构的定义即可,其它程序无需修改,省时省力。下面以TCP协议首部为例,说明如何定义协议结构。
TCP协议首部如图3所示:
图3:TCP首部
其协议结构定义如下:
struct TCPHEADER {
short SrcPort; // 16位源端口号
short DstPort; // 16位目的端口号
int SerialNo; // 32位序列号
int AckNo; // 32位确认号
unsigned char HaderLen : 4; // 4位首部长度
unsigned char Reserved1 : 4; // 保留6位中的4位
unsigned char Reserved2 : 2; // 保留6位中的2位
unsigned char URG : 1;
unsigned char ACK : 1;
unsigned char PSH : 1;
unsigned char RST : 1;
unsigned char SYN : 1;
unsigned char FIN : 1;
short WindowSize; // 16位窗口大小
short TcpChkSum; // 16位TCP检验和
short UrgentPointer; // 16位紧急指针
};
其协议结构还可以定义为如下的形式:
struct TCPHEADER {
short SrcPort; // 16位源端口号
short DstPort; // 16位目的端口号
int SerialNo; // 32位序列号
int AckNo; // 32位确认号
unsigned char HaderLen : 4; // 4位首部长度
unsigned char : 0; // 保留6位中的4位
unsigned char Reserved : 2; // 保留6位中的2位
unsigned char URG : 1;
unsigned char ACK : 1;
unsigned char PSH : 1;
unsigned char RST : 1;
unsigned char SYN : 1;
unsigned char FIN : 1;
short WindowSize; // 16位窗口大小
short TcpChkSum; // 16位TCP检验和
short UrgentPointer; // 16位紧急指针
};
参考资料:
1. 《Programmer's Guide》,DIGITAL UNIX Documentation,Version 4.0E。Compaq Computer Corporation, November 1998。
2. 微软MSDN Library Visual Studio 6.0版。
3. Borland C++ Builder 5.0联机文档。
4. 《C程序设计》,谭浩强,清华大学出版社,1991年7月。
5. 《TCP/IP详解 卷1:协议》,W. Richard Stevens著,范建华等译。机械工业出版社,2000年4月。