网站日志文件是seo或站长的“情报”,我们可以通过网站日志来分析搜索引擎蜘蛛的抓取情况,分析网站的收录异常,还有网站出状况时的原因调查。网站日志一般要主机服务商开通以后才会有。学会分析网站日志是成为一个SEOer高手的必经之路。
1.网站日志这个“情报”在哪里
网站日志是网站和搜索引擎对话交流留下的信息。通过日志可以了解搜索引擎的访问情况,一般通过主机服务商开通日志功能,再通过FTP访问网站的根目录,在根目录下可以看到一个包含log的文件夹,这个文件夹就是放网站日志的地方。通过下载,用记事本(或浏览器)打开就可以看到日志的内容了。
2.“情报”(网站日志)一般传递什么内容给我们
要知道网站日志文件内容所表达的内容是什么,我们要知道以下几个基础知识:
(1)各个搜索引擎的蜘蛛名称:百度-baiduspider,Google-Googlebot,MSN-msnbot,yahoo-Slurp,yodao-YoudaoBot、sogou-Sogou+get+spider。在日志的内容中搜索上述的的蜘蛛名就可以知道哪个搜索引擎的爬行和抓取痕迹了。
(2)常见返回的http状态码
在网站日志中最常见的HTTP状态码有200(页面抓取成功)、304(上次抓取的和这次抓取的没变化),404(未找到页面,错误链接)500(服务器未响应,一般由服务器维护和出故障,网站打不开时出现的)
我们知道了上述两个基本信息以后我们就可以根据网站日志进行分析了。一般来说我们只看百度和谷歌蜘蛛的爬行和抓取情况,当然有特殊需要的也可以对其他几个蜘蛛的爬行情况进行分析。网站日志中出现大量的谷歌蜘蛛和百度蜘蛛,说明搜索引擎蜘蛛时常来光顾你的网站。
3. 何时利用“情报”
当在下列情况时我们一般利用网站日志来分析:
(1)新站刚建立并提交给搜索引擎,想知道搜索引擎是否关顾我的网站。这种情况我们就要借助网站日志来观察了,看看网站日志的内容是否有提交的搜索引擎的蜘蛛来网站爬行抓取过,并且是不是返回200,如果返回的是404,说这个页面有问题,有可能是被转移了,被删了已经不存在了。这时候要做个重定向,把被转移的转向转移后的地址,或把删了的不存在的转向404页面。当然抓取成功后,放出来展示时间不同,一般谷歌展示出被收录的页面时间比较快,百度要20天左右才能展示出来。
(2)网站的收录异常时一般要把正常收录时的日志和异常时的日志对比来分析问题出在哪里,如果异常当天和前一天表现出蜘蛛明显锐减情况,观察是否是外链数减少了或者是网站近几天的内容有问题。如果异常当天和前一天的蜘蛛爬行数没有异常则认为是搜索引擎的展示问题所致。
(3)网站被封后抢救,这时可以观察日志来查看抢救后的效果。我们知道网站被封时,日志里只有很少的几个蜘蛛爬行了首页和robot.txt。通过被封的原因分析并改之,再提交给搜索引擎,接下来通过观察日志来看看蜘蛛的数量是否有增加。如果有增加并且返回的是200则代表抢救有效,如果几个月还是没有动静则可以选择放弃这个域名了。
4.擅于利用“情报”
网站日志这个“情报”往往被很多人忽视,很多站长或SEOer在遇到某些问题时第一个想到的就是去相关的论坛去提问,为什么不好好的利用手中的“情报”来分析下这个些问题产生的原因呢?所以在这里Sin想对忽视了网站日志的SEOer或站长们说一句:请好好的利用你的“情报”。
本文固定链接: http://www.nbseoer.com/archives/1774
宁波智森网络公司版权所有 转载请注明出处