最近有一个站PR上3,因为有几个PR5的外链单链过来,所以PR很快上3了。但百度一直不怎么收录。昨天晚上做了部分修改后,今早发了更新了部分内容,下午site的时候发现已经全部收录了,惊喜之下,分析了下原因。当然都是自我猜测啦:比如可能我采用了XHTML标准来布局网页,把部分代码做了精简等等。
前面都是废话,不好意思!主要是在看被百度收录的页面时发现了一句“为了提供最相关的结果,我们省略了一些内容相似的条目”。奇怪的时我发布的三篇信息,内容都大不相同呀。仔细检查后发现,被省略不显示的内容的标题有一部分另一篇被显示的网页的标题有重复的地方。这就让我想起了网页相似度的问题,以前对这个问题一直没有一个确切的 或者说能起关键作用的解决办法。今天遇到这个问题,莫非是跟网页标题有关?
总结如下:
相似的网页百度不会收录或者收录时不显示在搜索结果里 而是显示为"为了提供最相关的结果,我们省略了一些内容相似的条目"。所以在做内容页标题优化时 应当只包含内容页标题,不要包含网站名称、栏目名称或者其他可能重复的关键字。这样可以降低风页相似度,从而提高百度收录。