一个大型的网页搜索引擎需要极高效的搜索算法。如果仅仅依靠数据库的全文搜索能力,效率是很低的。传统提高效率的关键,是优化网页数据库的存储结构和索引。然而,当面临巨大的数据时,搜索结果是十分令人不满意的。象GOOGLE那样的搜索引擎,不是传统的搜索算法所能做到。
搜索的结果,是要提供给人们最有效的结果集。人脑的记忆与遗忘算法可以为我们提供借鉴。因为人脑不是把所有数据都当成一样重要地存储着,而是善于“遗忘”的。越多次被访问的数据,在人脑记忆中就显得越重要,也就越易于被人回忆(搜索)到;而长期未被访问的数据,就会被人脑遗忘。人脑的记忆遗忘机制为存储搜索提供了高效的搜索性能。
基于这个原理,我设计了一种高效的搜索算法。下面描述之。
(算法略)