十进制中看起来很简单的一个数0.1,在二进制中将是一个无穷循环数:0.00011001100110011...。这说明如果计算机使用二进制码来存储0.1,则必然需要舍去后面的循环位,从而必然存在误差。对于许多应用领域来说,这是不可忍受的。就比如美联储的利率吧,它的一个小小误差就能对美国乃至世界经济产生重要的影响。
这个问题有两个解决方法:第一个方法是增加计算机的表数位数,使这个误差变得非常小,直至可以忽略。这个方法的缺点是终归还是有误差的,而且更重要的是,它提高了数据的存储要求,降低的计算机的存储空间利用率。第二个方法是采用BCD码,即使用四位二进制码来表示一位十进制码。这样,0.1就可以这么表示:
0. 1
0000.0001
再比如18.56:
1 8. 5 6
0001 1000.0101 1010
可以看出,这种表示方法完全消除了误差。但它的缺点也不少:首先,每四位二进制码本来可以表示16个数,而现在只可以表示10个数(即十进制的0~9);其次,它要求计算机进行一些特殊处理,实际上,许多计算机都在硬件层面上提供了针对BCD码的操作指令。然而内存容量的不断扩大以及摩尔定律导致的芯片集成度的提高,使得BCD码得到广泛应用。
想一想,为什么二进制不能表示十进制的0.1呢?这是个实数与进制的问题。我们的讨论范围仅限于实数,而不管虚数。实际上,对于任何一种进制,二进制也好,十进制也好,实数都能被完全表示。因为每个进制都可以有无限小的数(0.0000.....1),每一个实数都可以由这些无限小的数简单相加构成。十进制里的0.1是一个实数,那它就一定可以由二进制来表示。但问题是这个对应的二进制数是个无限循环小数,这对于计算机来说,就相当于不可表示了(除非采用其他特殊标识方法)。所以“计算机不能用二进制来表示0.1”也就正确了,因为对于计算机来说,如果不是有限长的小数,那就是不可表示的了(取舍后的数已然不是原来的那个数了)。
再想一想,计算机中,有没有二进制数能表示而十进制不能表示的数?即在二进制中能用有限位表示而十进制中只能用无限位表示?答案是没有。所有的有限位二进制数均可以用一个对应的有限位十进制数来表示。我们知道,实数在数轴上是连续的,每一个小段都有无穷个连续的数。而十进制数可以分为两大类:无限数与有限数,无限数指的是只能用无限的十进制位来表示的实数,有限数则相反。这个界限很麻烦,我学计算机的,就从计算机的角度看这个无限与有限:
1.假设有两台计算机,一台是十进制计算机,另一台是二进制计算机,都能表示到小数点后100位小数(为方便,设整数部分为0);
2.假设当计算机无法用有限位表示时,这个实数就为无限数;
则可以推得,十进制计算机可以表示的小数个数是10^100,而二进制计算机可以表示的小数个数是2^100,可以看出,前者可以表示的小数个数是后者的(10/2)^100=5^100倍,而这些多出来的十进制小数,在二进制数中都需要超过100位的小数位才能精确表示。很简单,把100推广到有限/无限的界限上,那么就有一些十进制的有限位小数,只能用二级制的无限位小数来表示了,0.1就是一个这样的数。
如果定义一个表数密度:
a = (可用有限位表示的实数)/(实数总数)
从直觉上可以得出这个结论:进制数越大,表数密度a就越大,如十进制表数密度比二进制大,证明略。