由于Google一向收录公平、公正、公开,无论大站小站,只要一经收录就几乎每天来爬,新写的博文几分钟就可能被收录,现在着实没什么可说的,今天来跟大家聊聊百度。
怪现象之一:
在《宋夏博客通过了百度的新站考核期?》我就记录过,百度非常准时的每周来一次,不多不少,只在首页打个转就走。首页快照每隔7天更新一次,宋夏的站点成长日记有数据记录。不过突然从4月29日开始到昨天,连续8天每日更新我的首页,但在此期间我除了创建一些外部博客,偶尔换几个友链,没有什么其他外链。
怪现象之二:
收录页数从0增加至66页,博文不断更新,等了一周突然被K掉一个页面,收录数上升受阻。一个劲的收录我的TAG页,对日志页面却是爱答不理的。至今为止百度也没收录我的几篇日志,更别提通过百度关键词带来什么流量了。最让人抓狂的是,不仅收录TAG页,还收录缓存页,即便现在site也依然有不少已经删除的页面和不存在的缓存页。
揣测了半天也没搞明白百度大哥究竟是怎么个套路,但我还是折腾了些东西:
1、修改robots.txt。原本宋夏博客的写法是这样:http://www.isongxia.com/robots-txt-1.html,现在不做任何限制,具体可直接查看:http://www.isongxia.com/robots.txt
2、修改all in one seo插件设置,取消勾选以下三个选项。听闻百度蜘蛛比较傻,看到noindex就拍屁股走人。
Use noindex for Categories:
Use noindex for Archives:
Use noindex for Tag Archives:
3、缓存解决(访问量还没到加插件的地步,后面专门给大家分享网站提速),上个月末网站慢到一定程度,我自己都忍受不了,也难为百度了。
4、添加了一个柳城开发的插件。在此之前宋夏博客已经有Google站点地图和DDsitemapGen站点导航:http://www.isongxia.com/ddesignsitemapgen.html,听闻该插件对百度收录有好处,试试也无妨。
具体操作:
添加插件并激活,后台设置很简单,官方下载地址:http://wordpress.org/extend/plugins/baidu-sitemap-generator/
生成XML文件,如:http://www.isongxia.com/sitemap_baidu.xml,并已经添加至robots.txt
扩展功能,静态SITEMAP页面,如:http://www.isongxia.com/sitemap.html
大家再来看看今天的数据,和4月30日的变化(括号里面为4月30日数据):
查询时间:2010-5-7 22:7:23
查询域名:www.isongxia.com
Alexa排名:全球:471675 – 中国:20668(Alexa排名:全球:823513 – 中国:40920)
Sogou Rank:1
ChinaRank:191254
搜索引擎收录以及反向链接查询结果
baidu:收录 107 (快照时间:2010-5-6), 反向链接 295(baidu:收录 65 (快照时间:2010-4-29), 反向链接 14)
google:收录 256 , 反向链接 0
yahoo:收录 89 , 反向链接 656(yahoo:收录 50 , 反向链接 439)
soso:收录 58 , 反向链接 58
bing:收录 4 , 反向链接 1
sogou:收录 49 , 反向链接 48
yodao:收录 1 , 反向链接 0
做了这么多操作,百度的收录有略微的提升,但是收录的缓存页只是从前面跑到了后面,并没有从索引中被剔除,但总还是有些小进步,进一步观察效果的原因再分享给大家。