Google之所以伟大,其中一个极重要的原因是它的目标是远大并且符合人类切身利益的:索引全世界所有的信息,并且将它们变成人人皆可轻易获取的。这同 时也是极长远的目标,短期内是不可能实现的,因为这是一个信息爆炸的时代,Google不管多努力,都很难追赶得上信息的增长速度。当然,数十年甚至一百 年之后,这种状况说不定会有改变,谁也无法预测一百年后的世界或Google会是怎样的。1996年1月Sergey Brin及Larry Page在大学宿舍里研发出Google的前身BackRub,从那时开始,Google已经在索引全世界的信息了。那么在将近12年后的今天,到底 Google索引了多少信息?
这几乎是一个无解的问题,因为我们无法准确知道全世界的信息总量到底是多少。但如果你很好奇,我们可以参考一下一些非Google官方的统计数据。美 国伯克利加州大学资讯管理与系统学院(SIMS)曾多次计算过全世界产生的唯一信息量,它的研究结果被公认为是领域标准。根据knowledgebid的 报道,SIMS于1992年统计出来的世界新增信息总量(包括保存至影片、磁碟、光学档案及纸媒上的信息)为2132238TB~3212731TB,而 在2002年,这一数据为3416281TB~5609121TB。根据这一增长速度推算,那2006年世界所产生的新信息量应该在 6869341TB~11278629TB之间。
那Google索引了其中多少信息呢?根据2006年11月Google所发布的一份官方统计里的数据显示,当时Google的网络索引数据库里的信 息总量约为1085TB。如果综合上述SIMS推算数据来算,即Google仅仅索引了2006年世界新信息量的0.02%,甚至更少。
0.02%看起来微不足道,但已经是目前的极限了,因为Google已经是世界上最好的搜索引擎。在2005年Google CEO Eric Schmidt就曾预言过,要索引全世界的信息,Google可能需要300年的时间。300年?在互联网上,这已经相当于N个世纪了,现在想像好像还没 有意义。