我们都知道,在做SEO数据分析的时候,最准确的可能还是通过我们的网站日志来看蛛蛛网站访问情况。我们更多的时候可能还会用到类似GG管理员工具之类的。不是说那些不好,但那些相对真正要做数据分析来说,建议大家可以去看我们的网站日志。
可能还有些朋友不知道什么叫网站日志,我们怎么去看网站日志,这里我简单的说一下。毕竟我们今天的重点还是如何通过分析我们的网站日志,结合我们的SEO知识来提高我们的网站收录与蛛蛛爬取这个才是重要的。
网站日志他其它是一个.log的文本文件,一般都是以天为统计成一个文本。如果你是买的虚拟机,我们可以通过虚拟机的后台设置来生成.log日志文件。这个文件一般会在你的根目录下的log 文件目录下。在这个文件目录下我们就可以看到每日生成的日志文件了,它的作用也就是记录下当天的网站访问情况。
我们来看一段代码:2010-08-03 00:09:12 W3SVC962713505 203.171.226.111 GET /index.html – 80 – 61.135.168.39 Baiduspider
( http://www.baidu.com/search/spider.htm) 200 0 64
上面的这个是大家经常会看到网站日志代码,我简单的给大家说一下他大概的意思,2010年08月03日00点09分12秒IP为61.135.168.39的百度蛛蛛爬虫通过80端口有效的访访问了IP地址为203.171.226.111W3SVC962713505目录的index.html文件。这个是这段日志的译文。当然在我们的日志文件里,类似这样的信息应该会有比较多,如果你的站确实比较受欢迎的,那么一个小时内来十几次都是有可能的。
通过我们分析网站的日志,我们是不是不难发现。百度蛛蛛对于我们的网站首页的爬取率是最高的(权重页),这个也不难理解,因为做为网站来说更新的最快的,而且我们做锚文本链接的时候几乎都是以首页为主。那么结合着来说,我们的好些栏目页的蛛蛛爬取大多数是通过我们首页给他做的链接诱饵,引导蛛蛛来爬取我们的栏目从而收录。
特别是我们做企业站与商城的时候,我们会发现有些个页面非常难收录,在我们减少了网站的重复率来提高网站收录。那么我们能不能通过自己我的网站来做一个有效的引导呢。因为只有蛛蛛来爬过了我们的网页才有可能被收录。所以结合网站日志来提高网站收录的一个比较重要的思路:利用那些蛛蛛爬取频率比较高的页面上来做链接诱饵,来引导蛛蛛爬取我们的内页,从而达到网站收录量提高的这么一个目的。
本文由宁波SEO何涛提供,网址http:www.nb-seoer.com,欢迎转载 何涛SEO交流三群:123984595期待你的加入