在seo的过程中查看IIS日志是一件很重要的事,特别是当页面做了比较大的改动时,通过日志的检测,可以发现很多很有趣的问题。现在空间都提供日志查询的功能,而日志一般存放在网站根目录下的log、wwwlog、logfiles等类似的目录下,通过下载类似的文件解压了就可以用记事本就查看了。
下面我截取一段代码进行分析。
2010-07-24 02:20:57 W3SVC133 221.231.137.66 GET http://zuyupen5.com/Index.html – 80 – 123.125.66.111 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 64 0
2010-07-24 02:20:57 蜘蛛的访问时间
221.231.137.66 访问的IP地址
W3SVC133 机器码
GET 请求方式
/Index.html 请求的url
80 服务器端口号
123.125.66.111 服务器的IP
baiduspider 百度蜘蛛
200 0 64 0 200表示请求成功, 64意味着百度对于该页面的爬行并未完全读取完毕,在爬行的过程中放弃了,属于一个错误代码,而最后一个数据为0,则表示抓取的网页大小字节为0。
200 0 64 状态码的构成是:sc-status(协议状态,200在这里指连接成功) sc-substatus(协议子状态) sc-win32-status(Win32状态码,64是指定的网络名不可用
看第二个列子:
2010-07-24 12:37:39 W3SVC133 221.231.137.66 GET http://zero07.cn/501.html - 80 – 203.208.60.79 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0 6503
/501.html 请求的url
compatible 指兼容性
Googlebot 谷歌机器人
200 0 0 6503 请求成功并下载了6503字节数据。
一般我们只要看百度和google的蜘蛛就可以,其他的方法一样,就不在举例了。下面我列举下常见的HTTP状态码:
1xx(临时响应);2xx(成功);3xx(已重定向);4xx(请求错误);5xx(服务器错误);
200 – 服务器成功返回网页
301 - 永久性资源重定向
302 - 暂时性资源重定向
304 - 上次GET后,页面为发生变化
403 - 服务器已经请求,但还没执行
404 - 请求错误或请求失败
505 - HTTP 版本不受支持
不用太多,以上的HTTP状态码能看懂就好了,其他的状态码比较不常见,所以不要记了,用到的时候自己在搜索引擎里找下就可以了。
本文地址:http://zero07.cn/archives_95.html , 转载请保留.A5首发