雅虎搜索是怎样工作的?

王朝干货·作者佚名  2011-12-18
窄屏简体版  字體: |||超大  

搜集资料

首先搜索引擎会建立一个网页地图(Webmap),再使用网页抓取程序(Robot)根据网页地图来抓取(Crawl)网页,储存到搜索数据库中。

接下来会利用索引技术(Index)将数据做编号储存,同时搜索技术也会利用一些相关技术将不好的网站(Spam)去除。

将搜索结果进行排序

当使用者输入一个搜索词查询时,搜索引擎会用这个搜索词到搜索数据库中比对,并且经过一些相关度的运算之后,依照相关程度将网页做排序,相关度高的排在前面。

相关度的运算,除了判别网站名称或叙述内容中有符合搜索词的搜索结果,运算程序还会根据该网页被连结的次数等相关分数来计算,相关程度的高低是由搜索引擎程序运算,根据各种因素复合计算出来,并非绝对的单一因素。

更新网页数据

网页数据库每天都会进行部分数据的更新,由于数据库庞大,所有数据完全更新大约需要2到3个月的时间。

小贴士:① 若网友所发内容与教科书相悖,请以教科书为准;② 若网友所发内容与科学常识、官方权威机构相悖,请以后者为准;③ 若网友所发内容不正确或者违背公序良俗,右下举报/纠错。
 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
© 2005- 王朝網路 版權所有 導航