C语言编程常见问题解答之位(bit)和字节(byte)

位指的是二进制系统中的一位，它是最小的信息单位。位的用处可以从两方面去分析：第一，计算机对位的值可以有任意多种解释，例如表示"yes’’或"no”，或者表示磁盘是否已插入驱动器，或者表示某个鼠标键是否被按下；第二，将若干位的值连接起来后，就可以表示更复杂的数据，而且每增加一位，可以表示的可能的值的数目就会增加一倍。

换句话说，一位可以表示两种可能的值，即“O”和“1”；两位可以表示2×2或4种可能的值，即“00”，“01”，“10”和“11”；类似地，三位可以表示2×2×2或8种可能的值……。对计算机来说，位的这种特性既是最有力的支持——因为很复杂的数据(例如本书内容)可以被分解为位的表示后存储起来，又是最大的限制——因为在现实生活中许多事物的值是不精确的，这样的值无法用数目有限的若干位来表示。

程序员始终必须清楚每一项数据需要用多少位来表示。因为位作为单位太小，所以为了方便起见，大多数计算机所处理的信息单位是被称为字节的位块。字节是大多数计算机中最小的可寻址的信息单位，这意味着计算机给每一个字节的信息都赋予一个地址，并且一次只能存取一个字节的信息。一个字节中的位的数目可以是任意的，并且在不同的计算机中可以不同。最常见的情况是每个字节中有8位，即可以存放256个不同的值。8位这样的长度非常适合于存放表示ASCII(the American Standard Code for Information Interchange)字符的数据。

下述程序可以显示空格符以后的ASCII字符和PC机的图形字符集：

# include <stdio. h>

void main (void);

void main()

{

/" Display ASCII char set " /

unsigned char space = '' ; /* Start with SPACE

char = 8 bits only * /

int ctr = 0;

printf(" ASCII Characters\n" )»

printf (" = = = = = = = = = = = = = = = =\n" ) ;

for (ctr = O; ctr + space <256; ctr+ + )

printf("%c", ctr + space);

printf ("\n");

}

请注重，变量ctr必须是int类型，而不能是char类型，因为char类型只含8位，只能存放从0至255之间的值(signed char类型只能存放从-128至127之间的值)。假如ctr是char类型，它就永远不会存放256或比256更大的值，程序也就永远不会结束。此外，假如你在非PC机的计算机上运行上述程序，那么程序所打印的非ASCII字符可能会导致乱屏。

因为计算机是以字节块的方式工作的，所以大多数程序也以这种方式工作，有时，考虑到要存放的数据项的数目，或者移动每一位的信息所需的时间，节省内存空间就显得很有必要。

这时，我们通常会用少于一个字节的空间来存放那些只有少数可能值的数据，这也就是本章要讨论的主要内容。

10.1 用什么方法存储标志(flag)效率最高?

标志的作用是对程序执行过程中的两种或更多种选择作出决定。例如，在执行MS-DOS的dir命令时，可以用“／w”标志使该命令在屏幕上显示若干列文件名而不是每行只显示一个文件名。在3．5中你可以看到另外一个例子，该例通过一个标志从两种可能类型中选择一种在一个联合中使用。因为一个标志一般只有少数几个(通常是两个)值，所以，为了节省内存空间，通常不会将一个标志存放在一个属于它自己的int或char类型中。

存储标志值的效率是存储空间和存取速度之间的一种折衷。存储空间利用效率最高的存储方法是用数目足够的位来存储标志值的所有可能值，但大多数计算机不能直接寻址内存中单独的一位，因此标志值要从存放它的字节中提取。存取速度最快的存储方法是将每个标志值都存放到一个属于它自己的整型变量中，但是，当一个标志只需要一位存储空间而变量的长度为32位时，那么其余的31位就全部浪费掉了，因此这种方法的存储空间利用效率非常低。

假如标志的数目不多，那么使用哪种存储方法是没有关系的。假如标志的数目很多，那么最好将它们压缩存储在一个字符数组或整型数组中。这时，需要通过一种被称为位屏蔽(bit maSKINg)的过程来提取这些标志值，即屏蔽掉不需要的位，只处理所需的位。

有时，为了节省存储空间，可能会将一个标志和另外一个值存放在一起。例如，假如一个整型的值小于整型所能表示的最大值，那么就可用它的高阶位来存放标志；假如某些数据总是2或4的倍数，那么就可用它的低阶位来存放标志。在3．5的例子中，就使用了一个指针的低阶位来存放一个标志，该标志的作用是从两种可能的类型中选择一种作为该指针所指向的对象类型。

请参见：

10．2什么是“位屏蔽(bit masking)”?

10．3位域(bit fields)是可移植的吗?

10．4移位和乘以2这两种方式中哪一种更好?

10.2 什么是“位屏蔽(bit masking)”?

位屏蔽的含义是从包含多个位集的一个或一组字节中选出指定的一(些)位。为了检查一个字节中的某些位，可以让这个字节和屏蔽字(bit mask)进行按位与操作(C的按位与运算符为＆)——屏蔽字中与要检查的位对应的位全部为1，而其余的位(被屏蔽的位)全部为0。例如，为了检查变量flags的最低位，你可以让flags和最低位的屏蔽字进行按位与操作：

flags&1；

为了置位所需的位，可以让数据和屏蔽字进行按位或操作(C的按位或运算符为)。例如，你可以这样置位flags的最低位：

flags = flags 1；

或者这样：

flags = 1；

为了清除所需的位，可以让数据和对屏蔽字按位取反所得的值进行按位与操作。例如，你可以这样清除flags的最低位：

flags = flags& ~1;

或者这样：

flags&=~1 ;

有时，用宏来处理标志会更方便，例10．2中的程序就是通过一些宏简化了位操作。

例10．2 能使标志处理更方便的宏

/* Bit Masking * /

/ * Bit masking can be used to switch a character

between lowercase and uppercase * /

#define B99v_POS(N) ( 1U «(N) )

#define SET_FLAG(N,F) ( (N) = (F) )

#define CLR_FLAG(N,F) ( (N) &= - (F) )

#define TST_FLAGCN,F) ( (N) & (F) )

#define B99v_RANGE(N,M) ( B99v_POS((M) + 1- (N))-1<<(N))

#define B99v_SHIFTL(B,N) ( (unsigned)(B)«(N) )

#define B99v_SHIFTR(B,N) ( (unsigned)(B)»(N) )

#define SET_MFLAG(N,F,V) ( CLR_FLAG(N,F), SET_FLAG(N,V) )

#define CLR_MFLAG(N,F) ( (N) &= ~(F) )

#define GET_MFLAG(N,F) ( (N) & (F) )

# include <stdio. h>

void main()

{

unsigned char ascii_char = 'A'; /* char = 8 bits only */

int test_nbr = 10;

printf("Starting character = %c\n" , ascii_char);

/" The 5th bit position determines if the character is

uppercase or lowercase.

5th bit = 0 - Uppercase

5th bit = 1- Lowercase * /

printf ("\nTurn 5th bit on = %c\n" , SET_FLAG(ascii_char, B99v_POS(5)));

printf ("Turn 5th bit off = %c\n\n",CLR_FLAG(ascii_char, B99v_POS(5)));

printf ("Look at shifting bits\n");

printf (" = = = = = = = = = = = = = = = =\n" );

printf ("Current value = %d\n" , test_nbr)i

printf ("Shifting one position left = %d\n" ,

test_nbr = B99v_SHIFTL(test_nbr, 1) );

printf ("Shifting two positions right = %d\n" ,

B99v_SHIFTR(test_nbr, 2) );

}

宏B99v_POS(N)能返回一个和N指定的位对应的屏蔽字(例如B99v_POS(O)和B99v_POS(1)分别返回最低位和倒数第二位的屏蔽字)，因此你可以用

#define A_FLAG B99v_POS(12)

&nb