就两个月网站改版的经历来看,百度收录新文章有一个规则,当然这不一定正确,也不一定对所有网站都通用。这里所说的更新的新文章基本上都是原创文章,所以对于那些采集的或者伪原创的站来说可能不太准。
有大概两个星期的时间,每天都会给网站更新10条左右的原创文章,一般发布以后1小时左右就可以在百度查到了。可是一连好几天,发现即使是百分之百原创的文章,百度也不一定会收录,这就让人费解了,百度不是一向都很喜欢原创的东西么?网站其它方面也都没做什么会引起它不收录的动作啊?后来仔细想想觉得只有一个原因能解释这种现象,就是当天更新的文章都是同一个系列的,并且文章的关键词都一样,比如说“百度收录新文章的时间”“百度收录新文章的次序”“百度收录新文章的规则”“百度收录新文章的重要性”······即使这些文章的内容都是在讲不同的东西,但是对于可能对于百度的爬虫来讲,这些文章都是在讨论一个话题,你的网站是故意分成这么多篇来发布的。
有几天在发布了几篇上面的那种一系列的文章之后,又发了几篇主题完全不同的,再过几小时百度查收录的时候发现,一系列的文章中只有一篇收录了,但是其它几篇不同主题的确全部收录了,无一例外。这至少说明了百度不喜欢同一时间段收录很多相似的内容。
后来就试着一天内更新的文章至少不要都是同一个系列的,确实只有同一系列的也没关系,把标题取得差异性大一点,这样发布以后再去查百度收录,那基本上都条条收录。所以总结出一个规律,主题太接近的同系列文章,不要再同一天发布,分开来慢慢发布,这样效果更好。如果每天都能给网站的每一个板块都更新一篇,那是最好不过了。
本文纯属菜鸟扯淡,请大家轻点拍砖。