分享
 
 
 

网站排名核心技巧:如何正确分析W3C扩展日志

王朝网站推广·作者佚名  2011-12-05
窄屏简体版  字體: |||超大  

由于最近百度更新,使得有个网站在百度的排名消失了,不得已调查了一下网站的访问日志,以便分析排名消失的原因。想要看懂网站的访问日志,就必须了解些参数表示的意义,在IIS6.0中,这些参数是非常标准的,对我们分析蜘蛛的爬行和网页的收录是有非常大的帮助的。

下面就让我们来耐心的学习这些参数吧。

注:以下部分翻译自Microsoft网站--《W3C Extended Log File Format (IIS 6.0)》的解释。

W3C扩展日志文件格式是IIS(Microsoft IIS)的默认日志格式,其内容编码为默认的ASCII文本。你可以通过IIS管理器选择各种不同的字段包含在这种日志文件内,这样可以使你的日志内容更加人性化。其实系统是通过HTTP.sys句柄来处理W3C扩展日志的,W3C内容格式完全是通过读取HTTP.sys的内核缓存进行筛选获取的。

下表中列出各种可选字段(“字段标识”列为实际参数名)及其描述,并通过Default列记录该字段是否默认被‘包含’了。

“字段” “字段标识” “描述” “Default(Y/N )”

日期 date 动作发生时的日期。 Y

时间 time 动作发生时的时间(默认为UTC标准)。 Y

客户端IP地址 c-ip 访问服务器的客户端IP地址。 Y

用户名 cs-username 通过身份验证的访问服务器的用户名。不包括匿名用户(用‘-’表示)。 Y

服务名 s-sitename 客户所访问的Internet服务名以及实例号。 N

服务器名 s-computername 产生日志条目的服务器的名字。 N

服务器IP 地址 s-ip 产生日志条目的服务器的IP地址。 Y

服务器端口 s-port 服务端提供服务的传输层端口。 Y

方法 cs-method 客户端执行的行为(主要是GET与POST行为)。 Y

URI Stem cs-uri-stem 被访问的资源,如Default.asp等。 Y

URI Query cs-uri-query 客户端提交的参数(包括GET与POST行为)。 Y

协议状态 sc-status 用HTTP或者FTP术语所描述的、行为执行后的返回状态。 Y

Win32状态 sc-win32-status 用Microsoft Windows的术语所描述的动作状态。N

发送字节数 sc-bytes 服务端发送给客户端的字节数。 N

接受字节数 cs-bytes 服务端从客户端接收到的字节数。 N

花费时间 time-taken 执行此次行为所消耗的时间,以毫秒为单位。 N

协议版本 cs-version 客户端所用的协议(HTTP、FTP)版本。对HTTP协议来说是HTTP 1.0或者HTTP 1.1。 N

主机 cs-host 客户端的HTTP报头(host header)信息。 N

用户代理 cs(User-Agent) 客户端所用的浏览器版本信息。 Y

Cookie cs(Cookie) 发送或者接受到的cookie内容。 N

Referrer cs(Referer) 用户浏览的前一个网址,当前网址是从该网址链接过来的。 N

协议底层状态 sc-substatus 协议底层状态的一些错误信息。 Y

关于status codes字段的更多详细资料请浏览:“http://go.microsoft.com/fwlink/?LinkId=14381”。

注:其实我们对比一下实际操作会发现“Default”一列是与客观事实有些出入的:P。

下面我们就几个案例进行“还原”:

案例一:某网站http://www.test.com的日志ex050104.log的一段内容:

#Software: Microsoft Internet Information Services 6.0

#Version: 1.0

#Date: 2005-01-03 16:00:00

#Fields: date time cs-method cs-uri-stem cs-uri-query c-ip cs(Referer) sc-status sc-bytes cs-bytes time-taken

2005-01-01 16:02:22 GET /Enterprise/detail.asp id=1612186 70.25.29.53 http://www.test.com/searchout.asp 200 17735 369 4656

这里我们可以得到的资料是:这是一台装有IIS version 6的WEB服务器(通过#Software标识),版本是1.0(#Version标识),成日期是2005年1月3日的下午4点正(#Date标识),下面生成的W3C日志内容(通过#Fields标识)包括日期、时间、Clientto Server的方法、读取的对象、参数、客户端的IP地址、客户端上一个访问的对象、服务返回的状态、Server to Client的字节、Server接收到的字节、处理该条目的操作总共使用的时间。最后还原的结果是:

在2005年1月1日的下午4时2分22秒,70.25.29.53这个IP地址的客户端向我们的服务器提交了一个GET:

http://www.test.com/Enterprise/detail.asp?id=1612186

网址的请求,这个请求提交的网址可能是从http://www.test.com/searchout.asp链接过来的,本次操作返回“操作成功”应答(成功完成操作),此次操作中服务端发送给客户端17735个字节的数据,服务端也接收到369个字节的数据,此次操作总共花了4656毫秒。

从上面的知识点不难看到,其实我们要通过W3C扩展日志对HTTP应用层行为进行监控的话,以下几个字段的记录是必不可少的:

date、time、cs-method、cs-uri-stem、cs-uri-query、c-ip、cs-version、cs(User-Agent)、cs(Referer)、sc-status、

sc-bytes、cs-bytes、time-taken、cs-host、cs(Cookie)。解说一下:

date和time就不用说了;

cs-method与cs-uri-stem、cs-uri-query联合起来,很快就可以还原出c-ip究竟进行过怎么样的请求;

sc-status可以帮助我们辨别这个请求是否成功‘执行’,从而辨别现象与这个请求操作的依从性;

cs-version、cs(User-Agent)、cs(Referer)、cs-bytes、cs-host与cs(Cookie)可以作为一个类比的特征指纹,鉴别出一些非正常的请求,如HTTP探测、HTTP DoS与CC等;

cs-bytes、sc-bytes与time-taken可以帮助我们辨别本次请求所耗费的各种资源的情况(如对带宽的影响、CPU/内存资源占用的影响)。

通过学习这些参数的含义后,我非常轻松地看完了网站访问日志,从中分析出了排名消失的初步原因或主要原因,为进一步调整优化提供了依据。最后,一套行之有效的总结、归类、对比方法可以更快地帮你定位到问题的根源,例如:“通过多个cs-uri-query的值相同或相似,且发生的时间点几乎一致等各种因素,判断其可能遭受过CC攻击”等,这样的案例常有存在,关键看自己的领悟了。

91SEO小站(www.91seo.net),转载请注明出处。

 
 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
2023年上半年GDP全球前十五强
 百态   2023-10-24
美众议院议长启动对拜登的弹劾调查
 百态   2023-09-13
上海、济南、武汉等多地出现不明坠落物
 探索   2023-09-06
印度或要将国名改为“巴拉特”
 百态   2023-09-06
男子为女友送行,买票不登机被捕
 百态   2023-08-20
手机地震预警功能怎么开?
 干货   2023-08-06
女子4年卖2套房花700多万做美容:不但没变美脸,面部还出现变形
 百态   2023-08-04
住户一楼被水淹 还冲来8头猪
 百态   2023-07-31
女子体内爬出大量瓜子状活虫
 百态   2023-07-25
地球连续35年收到神秘规律性信号,网友:不要回答!
 探索   2023-07-21
全球镓价格本周大涨27%
 探索   2023-07-09
钱都流向了那些不缺钱的人,苦都留给了能吃苦的人
 探索   2023-07-02
倩女手游刀客魅者强控制(强混乱强眩晕强睡眠)和对应控制抗性的关系
 百态   2020-08-20
美国5月9日最新疫情:美国确诊人数突破131万
 百态   2020-05-09
荷兰政府宣布将集体辞职
 干货   2020-04-30
倩女幽魂手游师徒任务情义春秋猜成语答案逍遥观:鹏程万里
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案神机营:射石饮羽
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案昆仑山:拔刀相助
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案天工阁:鬼斧神工
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案丝路古道:单枪匹马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:与虎谋皮
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:李代桃僵
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案镇郊荒野:指鹿为马
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:小鸟依人
 干货   2019-11-12
倩女幽魂手游师徒任务情义春秋猜成语答案金陵:千金买邻
 干货   2019-11-12
 
推荐阅读
 
 
 
>>返回首頁<<
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有