前段时间对于百度推出的<不相关静态搜索结果页将被严厉处理>大概内容如下:百度网页搜索反作弊团队近期发现一部分网站遍历热门关键词生成大量的站内搜索结果页来获取搜索引擎流量,其中存在大量的不相关内容严重损害了搜索引擎的用户体验并且侵占了相应领域的优质网站收益,对于此类网站我们将做出严厉的处理,希望存在此问题的站长及时进行整改调整。
搜索结果页面,也就是网站站内的聚合搜索结果展示,不少SEO对于聚合搜索骗取大量的搜索引擎流量,具体表现为,对行业的相关关键词整理,大批量的生成相关关键词聚合页面,然后通过内外链提升聚合页面百度收录。具体对于百度的惩罚我就不多说,我探讨的是百度如何对聚合搜索相关性搜索结果页面的判断!
1,根据网站的页面价值来判断
搜索引擎可以依据用户的行为来判断网站搜索页面的价值。例如搜索招聘信息,58同城和51JOB之类的的搜索使用率较高,而论坛和门户网站搜索使用率则较低。所以搜索引擎可以根据用户的行为来判断搜索使用率较高的网站搜索结果页面价值高,而搜索使用率很低的网站,搜索结果页面价值低。倘若搜索使用率很低的网站,生成大量搜索静态页面,将会被搜索引擎认为有作弊的嫌疑!
2,根据页面的生成时间判断
正常的生成相关搜索静态页面,在时间上应该是有一定规律的。而不会出现在某个时间内大量的出现相关搜索静态页面,通过作弊的SEO通常都是收集成千上万个相关关键词一次性批量生成静态页面。
3,根据页面数量上判断
搜索结果页面数量是和网站的内容以及用户是存在的关联性的。打个比例,www.dgsongliaoji.com 你的网站页面只有2000个,而用户只有1000个,而你的搜索结果静态页面却出来了10000个甚至更多那么搜索引擎也可以大致可以判断出你的网站是存在在人工干扰的,因为正常用户搜索比例不会这么高。也就是说搜索页面应该占网站总页面的一个正常比例。而不应该过高!
4,关键词是否存在搜索价值
百度很明确同时也知道什么样的关键词对于用户来说是有搜索价值的!。而通过作弊的SEO都是通过采集软件进行关键词和内容的采集,并没有通过判断和选择这些关键词是否有可搜索性。而且通过采集软件采集的内容有很大部分的关键词是存在语义错误的!
5,内容相关性和内容质量的判断
百度需要判断页面的相关性,同时也还需要判断页面的质量。那么百度是如何判断页面相关性,从页面内容上面进行分析,这方面的技术百度积累很久。另一方面就是判断页面的质量,从用户角度分析,分析用户在页面的停留时间和跳出率来判断这个页面是否对用户有用从而判断页面的质量。