超链分析技术百度李彦宏曾经申请并获得对于超链接分析的专利,其基本原理是:在某次搜索的所有结果中,被其他网页用超链指向的越多的网页,他的价值就越高,就越应该获得好的排名。
超链分析要解决的是文件与搜索词的相关性,李彦宏提出的方法是除了网页本身对关键词的引用外,还需要考虑反向链接中的关键词。这一方法的推行,也得益于百度蜘蛛强大的爬行能力.
基本的思路是,百度蜘蛛在抓取网页并存入数据库的时候会连指向这个网页的超链接,以及每个超链接当中使用的锚文本,一同存储起来。而搜索词也会建立一个数据库,每个词连同含有这个词的超链接,以及这些超链接所指向的网页一同被记录在案。当用户搜索某个关键词的时候,含有以关键词为链接文字的反向链接数目最多的那个网页,将被作为最相关的结果排在前面。(本段引用自Zac Google PageRank专利和李彦宏超链分析专利的区别)。
超链分析是一种引用投票机制,网页被引用的次数越多,说明网页的重要程度越高,以此来判断,即大家普遍认为从是好内容的,那么它就应该排在搜索结果的前面,从而为用户提供出更重要、更有价值的搜索信息。
超链分析技术会分析索引网页本身的文字,还要分析索引所有指向该网页的链接的URL、锚文字,甚至链接周围的文字。举个例子对上面的分析做个说明。AnQ的网站,很多朋友在引用我网站的时候,普遍用中国网站设计作为锚文本,当蜘蛛抓取网页的时候,就会连同以中国网站设计为锚文本的链接一同存储起来,越多人用中国网站设计一词指向AnQ网站,当用户搜索中国网站设计一词的时候,搜索引擎就会认为,我的网站和这个搜索词相关度更高,因此会给予更高的排序位置。
欢迎转载,有兴趣转载的,请注明文章来自中国网站设计网http://www.wzhan.net,非常感谢