现在谷歌已经离我们渐行渐远,百度就成为我们站长的最大的山头。在网站优化战争中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可就是不收录内页?
以下总结了几点网站内页百度不收录的原因分析与对策,和大家一起讨论,研究。
原因1:robots设置不正确导致内页不受引擎蜘蛛爬行索引
举例:禁止搜索引擎收录网站的某些目录:
User-agent: *
Disallow: /目录名1/
Disallow: /目录名2/
Disallow: /目录名3/
对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。
原因2:百度已经索引了但还未放出来排名。百度对文章的收录需要一段审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。
对策:我们要做的工作就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,一定会有惊喜的。
原因3:网站内部链接存在问题,比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。
对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。
原因4:文章原创度问题,头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。
对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。
由 http://www.80try.cn 原创,转载请注明出处。