大家在编程的过程中,经常会遇到需要输入一个不定长字符串的情况。通常来说,解决这个问题可以有两种方法:
一是先分配一个固定长度的缓冲区,把输入的字符串先存储到这个缓冲区,然后再根据其长度动态分配内存。这个方法缺点是无论分配多大的缓冲区,都无法完全满足要求。太大浪费内存,太小会发生字符串截断。
二是逐个字符输入,然后通过realloc函数来实时改变缓冲区的大小。这个方法比第一个方法稍微好一点。但缺点是动态分配函数使用频率高,效率太低。
以上两种方法都有比较明显的缺点,那么有没有更好的方法呢?当然是有的,我们可以在FILE文件结构上做做文章。FILE文件结构是编译器相关的,通常不同编译器有不同的结构成员,但一般来说,都会包含关于缓冲区的信息,我们可以利用这些信息来事先获得输入字符串的字符数量,再根据这个数量分配内存。
Borland编译器的FILE结构含有缓冲区的大小和首地址信息,bsize成员保存缓冲区的大小,buffer指针成员保存缓冲区的首地址。在缓冲区中,输入回车的时候,通常以0x0A表示,我们可以在缓冲区中通过寻找这个0x0A来计算字符数量,简化代码如下:
char c, *cpBuffer;
int i;
c = getchar();
for(i=0; i<stdin->bsize; ++i) if(*(stdin->buffer+i) == 0x0A) break; //取得字符数量
cpBuffer = (char*)malloc(i*sizeof(char)+1); //加1是考虑后面加入'\0'
memcpy(cpBuffer, stdin->buffer, i?i:1);
*(cpBuffer+i) = '\0';
计算字符数量的循环考虑bsize是因为如果输入字符数量比缓冲区的size大,那么不会产生0x0A。默认缓冲区大小是512,如果需要更大的输入缓冲,可以通过setvbuf函数来改变缓冲的大小。
如果编译器使用VC,就更方便了,VC的FILE结构包含了缓冲区的字符数量,成员名叫_cnt,简化代码如下:
char c, *cpBuffer;
int iCount;
c = getchar();
iCount = stdin->_cnt; //取得字符数量
cpBuffer = (char*)malloc(iCount+1);
memcpy(cpBuffer, stdin->buffer, iCount?iCount:1);
*(cpBuffer+iCount) = '\0';