在正式发表文章之前 先解释一个专有名词:
蜘蛛: 蜘蛛(Spider)是搜索引擎的一个自动程序,它的作用是访问互联网上的HTML网页 ,建立索引数据库,使用户能在搜索引擎中搜索到网站的网页。
简单的说,它是网站与搜索引擎交流的工具,正式有了蜘蛛,搜索引擎才能知道你的站点,进而才产生了收录和排名。因为蜘蛛是一个自动程序,依靠各项设定的原则来行动,所以通过跟踪蜘蛛的动向和搜索引擎的反应,就可以有的放矢地对网站进行优化。
总是有人在一些论坛上发上一些关于百度收录又消失的问题,我想就此发一下个人的观点。
首先 蜘蛛爬到你的主页 会随着你的链接不断的进行爬寻 在爬寻的过程中不断地将文章和百度首次收录算法进行对比 这个要求很低 只要是出现他们喜欢的“关键字”你的站将很快就会被收录,于是很多人的文章很快就被收录了,欢天喜地,但是第二天却又被百度删除,哭丧着脸跑到各个论坛不断的询问,这是为什么呢?相信这是SEO初学者的一个共同疑问。
答案是 蜘蛛虽然把你带回了家,但是他还要进行第二次数据对比,这就需要另外一只蜘蛛(这里强调下,研究搜索引擎的算法的时候我们一定要从实际出发,如果你是搜索引擎蜘蛛的研究者,你是否能够用一个蜘蛛就实现这个些功能呢,显眼为了分工明确 百度派出了很多的蜘蛛各司其职 原理如同我们的CUP 多线程)将其与数据库中的文章进行对比,如果文章内容重复读超出60%便会默认为同样的文章,这样就是SEO界所谓的“页面相似度过高”,容易导致失去百度信任进而有被降权的可能性.
说了这么,主要就是阐述一下 很多人问过的 为何百度收录了我的文章,很快又消失了的原因。
总结,SEO界有一句大家认同的话“内容为王”,的确是这样老老实实做站 只要坚持内容原创 相信你的站距离成功不再遥远。
本文首发 www.gzbzm1.cn 转载请保留链接,谢谢!