我们知道网站SEO优化顺序是先“内”后“外”,先“内”就是要首先从网站的自身内部开始,“内”不单指原创的内容也包括网站的结构设计和用户的体验度设计等内在因素,凡易于搜索引擎识别和收录的就是我们要去做的。很多的时候我们碰到问题时先从自身去找问题,解决了内在的问题,外部问题也就简单多了。下面是我在实际网站SEO过程中碰到的一些疑难问题,总结出来,希望大家对帮助:
案例一:某网站是5~6年的老站了,收录数一直不多,自从开始重视SEO,经多次调整,包括:建立网站地图,动态页面静态化,添加外部链接等工作,但百度收录数依然不明显。网站由于自身的业务要求,每天原创内容都有几十篇,外链也直接做了网易等高权重网站的友情链,但感觉效果不明显。
诊断过程:首先把一篇原创文章直接放在首页,以便让从网易友链过来的蜘蛛可直接找到,借此观察百度的收录情况,二天后检查结果是百度无收录,难道百度蜘蛛不来造访?打开网站日志查找百度蜘蛛访问记录,经查蜘蛛访问记录正常,但访问首页代码是302,302表示跳转,一来就跑,这就奇怪了?再仔细检查了网站首页的程序代码,其中无任何跳转代码,程序执行结果显示的内容与浏览器反应的结果是一致的。难道蜘蛛走的路径和浏览器走的路径不一致?找来技术员一问,才恍然大悟,原来网站同时兼容WAP,如果用户是从手机造访网站则跳转到WAP网站,否则访问WEB网站,技术员简单通过user-agent关键字来判断用户是手机浏览器还是WEB浏览器然后跳转,但忽略了搜索引擎的蜘蛛,所有蜘蛛被导引到WAP上,网站更新的内容无法被蜘蛛搜到并收录,这就是出现302的原因。解决办法:修改WAP判断标准即可,实际中修改后,原创的文章第二天就百度就收录了。
案例二:某采集站采集的内容的展现一直是动态页面来做的,自从改成静态页面后,百度收录数开始下降,虽不明显,但与之前的收录数每天增长呈反势,感觉不正常了。
诊断过程:通过site命令检查网站每天新收录数与变更之前的每天收录数是否有明显下降(因为每天采集数大致相同,百度收录数也大致相同),检查结果是无明变化,初步判断是更久以前的收录被踢出百度了,有可能是内容过时或与其他网站重复性太高,但由于收录变化是出现在变更动态页前后,最后还是不死心查了一下网站日志,才发现百度蜘蛛访问一些页面出现大量404错误,404表示页面不存在,再仔细检查这些的页面,大部分是静态文件后多加上了一个page参数,再检查,发现该page是内容评论程序强行加上去的,再检查URL重写规则,其中并无对page的处理,新增这一处理规则后问题得到解决,收录数又重新恢复到以前的每日递增状态。问题虽然解决但疑问始终存在:(1)百度蜘蛛访问出现404错误的页面都是较旧的收录(几个月以前的内容),新收录则一个都无,为什么?(2)蜘蛛理应访问是不带page的页面,因为只有当评论数超过一页需要翻页时才会加上page参数,百度蜘蛛如何找到这个加page的入口的,难道百度对旧收录数据还要重新分析?不解。
本文由球趣吧http://www.qiuqu8.com撰写,请尊重别人的劳动成果,转载留下文章出处。