C编译器对结构空间的分配及其应用

C编译器对结构空间缺省的分配

在C语言中，结构是一种复合数据类型，其构成元素既可以是基本数据类型（如int、long、float等）的变量，也可以是一些复合数据类型（如数组、结构、联合等等）的数据单元。在结构中，编译器为结构的每个成员按其自然对界（alignment）条件分配空间；各个成员按照它们被声明的顺序在内存中顺序存储，第一个成员的地址和整个结构的地址相同。在缺省情况下，C编译器为每一个变量或是数据单元按其自然对界条件分配空间，见表1：

表1：Win32下的自然对界条件

例如，下面的结构各成员空间分配情况如图1：

struct test {

char x1;

short x2;

float x3;

char x4;

};

图1：缺省结构空间分配

结构的第一个成员x1，其偏移地址为0，占据了第1个字节。第二个成员x2为short类型，其起始地址必须2字节对界，因此，编译器在x2和x1之间填充了一个空字节。结构的第三个成员x3和第四个成员x4恰好落在其自然对界地址上，在它们前面不需要额外的填充字节。在test结构中，成员x3要求4字节对界，是该结构所有成员中要求的最大对界单元，因而test结构的自然对界条件为4字节，编译器在成员x4后面填充了3个空字节。整个结构所占据空间为12字节。

结构中的位段

所谓位段是以位为单位定义长度的结构体类型中的成员。编译器对结构中位段的分配遵从下面几点原则：

? 对于长度为0的位段，其下一个位段从下一个存储单元开始存放：

如：

struct T {

unsigned char a : 1;

unsigned char b : 2;

unsigned : 0;

unsigned c : 3;

};

结构T的成员a和b在一个存储单元中，c则在另一个存储单元中。

· 一个位段必须存储在同一存储单元中，不能跨两个单元：

如：

struct T {

unsigned char a : 4;

unsigned char b : 6;

};

结构T的成员a在一个存储单元中，b则在另一个存储单元中。

更改C编译器的缺省分配策略

一般地，可以通过下面的两种方法改变缺省的对界条件：

· 使用伪指令#pragma pack ([n])

· 在编译时使用命令行参数

#pragma pack ([n])伪指令允许你选择编译器为数据分配空间所采取的对界策略，见表2：

表2：更改缺省对界条件

在Microsfot Visual C++中，命令行参数/Zp[n]可以改变缺省对界条件；在Borland C++ Builder中，命令行参数-a[n]可以改变缺省对界条件。n的含义和#pragma pack中的n相同。

例如，在使用了#pragma pack (1)伪指令后，test结构各成员的空间分配情况如图2所示：

图2：使用#pragma pack (1)后的结构空间分配

应用实例

我们在日常编程工作中，特别是对一些网络事务的处理，经常会同其他人有着各种各样的协议：如我传给你20字节的头，前4个字节表示……等等。很多人都是通过指针偏移的方法来得到各种信息，这样做，不仅编程复杂，而且一旦协议有变化，程序修改起来也比较麻烦。在了解了编译器对结构空间的分配原则之后，我们完全可以利用这一特性定义自己的协议结构，通过访问结构的成员来获取各种信息。这样做，不仅简化了编程，而且即使协议发生变化，我们也只需修改协议结构的定义即可，其它程序无需修改，省时省力。下面以TCP协议首部为例，说明如何定义协议结构。

TCP协议首部如图3所示：

图3：TCP首部

其协议结构定义如下：

struct TCPHEADER {

short SrcPort; // 16位源端口号

short DstPort; // 16位目的端口号

int SerialNo; // 32位序列号

int AckNo; // 32位确认号

unsigned char HaderLen : 4; // 4位首部长度

unsigned char Reserved1 : 4; // 保留6位中的4位

unsigned char Reserved2 : 2; // 保留6位中的2位

unsigned char URG : 1;

unsigned char ACK : 1;

unsigned char PSH : 1;

unsigned char RST : 1;

unsigned char SYN : 1;

unsigned char FIN : 1;

short WindowSize; // 16位窗口大小

short TcpChkSum; // 16位TCP检验和

short UrgentPointer; // 16位紧急指针

};

其协议结构还可以定义为如下的形式：

struct TCPHEADER {

short SrcPort; // 16位源端口号

short DstPort; // 16位目的端口号

int SerialNo; // 32位序列号

int AckNo; // 32位确认号

unsigned char HaderLen : 4; // 4位首部长度

unsigned char : 0; // 保留6位中的4位

unsigned char Reserved : 2; // 保留6位中的2位

unsigned char URG : 1;

unsigned char ACK : 1;

unsigned char PSH : 1;

unsigned char RST : 1;

unsigned char SYN : 1;

unsigned char FIN : 1;

short WindowSize; // 16位窗口大小

short TcpChkSum; // 16位TCP检验和

short UrgentPointer; // 16位紧急指针

};

参考资料：

1. 《Programmer's Guide》，DIGITAL UNIX Documentation，Version 4.0E。Compaq Computer Corporation， November 1998。

2. 微软MSDN Library Visual Studio 6.0版。

3. Borland C++ Builder 5.0联机文档。

4. 《C程序设计》，谭浩强，清华大学出版社，1991年7月。

5. 《TCP/IP详解卷1：协议》，W. Richard Stevens著，范建华等译。机械工业出版社，2000年4月。