众所周知,搜索引擎会更加重视原创性内容。因此,很多SEOer就提出了所谓伪原创的手法。简单的说,伪原创就是对原创性文章进行相应的修改,从而企图达到让搜索引擎认为他是原创性文章的目的。
伪原创其实是一种自欺欺人的做法,与掩耳盗铃之人没有什么两样。所谓的伪原创能否达到目的,这我们得从搜索引擎如何识别镜像、转载网页说起。下面,介绍地介绍一下搜索引擎识别镜像、转载网页的原理(如有不当之处,还请指正):
1. 镜像页面的识别:例如:对于网页A,B,要判断这两个页面是否互为镜像网页,那么搜索引擎首先会把这两个网页划分为若干个独立的区域,再按顺序对这些区域进行比较,如果这些区域的内容完全相同,那么搜索引擎就认为这两个页面互为镜像页面;然后,再根据网页建立的时间等多方面的因素判断哪个是原创页面,哪个是镜像页面。
2. 转载网页的识别:例如:对于网页A,B,要判断这两个页面是否互为转载网页,那么搜索引擎首先会把这两个网页的主体内容(如文章内容)划分为若干个独立的区域,再按顺序对这些区域进行比较,如果这些区域的内容大部分都是相同,那么搜索引擎就认为这两个页面互为转载页面;然后,再根据网页建立的时间等多方面的因素判断哪个是原创页面,哪个是转载页面。
(注:关于镜像、转载网页的识别的详细内容大家可以参考《SEO教程:搜索引擎优化入门与进阶》一书。)
从上面的内容里,我们得知了搜索引擎识别转载页面的原理。简单地说,如要我们要让搜索引擎认为我们的内容是原创内容,那么首要的条件就是我们的网页跟另外一个网页在主体内容(如文章内容)上存在明显的差别。例如:一篇文章有四个段落,当有三个段落的内容存在差异时,会被认为是原创网页,而两个段落内容存在80%以上的差别上,才会被认为是不同的段落。
看在这里,相信大部分的读者都有点头绪了。一篇文章要做这么多的修改后才会被认为原创文章,那么这篇文章还是原来你抄袭的文章吗?这比自己重新写一篇文章要简单吗?