写这篇文章是因为最近收到很多人的咨询,感觉很多人还是没有去看最基础的东西-《google网站质量指南》。有些人是不知道怎么看,有些人是不屑于看吧。所以再啰嗦的写一下如何看这个《指南》。
其实很多的SEO技巧,在这里都写得清清楚楚的,很多技巧是连一些目前的SEO专家都还不知道的。虽然我说新手要去看《指南》,但是很多SEO多年从业人员都可以看看。
SEO如果算是一门学问的话,那它和其他所有的学问一样。都要从最基本的东西学起,要下得了苦功夫的。最近翻《读者》的时候看到一个故事,觉得应该和大家分享一遍,文章抄录如下:
陆宗达曾拜国学大师黄侃为师。见过先生,黄侃一个字也没给陆宗达讲,只给他一本没有标点的《说文解字》,说:“点上标点,点完见我。”陆宗达依教而行。
再见老师时,黄侃翻了翻那卷了边的书,说:“再买一本,重新点上。”
第三次见老师时,陆宗达送上点点画画得已经不成样子的《说文解字》。黄侃点点 头,说:“再去买一本点上。”
三个月后,陆宗达又将一本翻得很破的《说文解字》拿来,说:“老师,是不是还要再点一本?我已经准备好了。”
黄侃说:“标点三次,《说文解字》你已经烂熟于心,这文字之学,你已得大半,不用再点了。以后,你做学问也用不着再翻这书了。”黄侃将书扔进书堆里,这才给陆宗达讲起了学问的事。
后来,陆宗达终于成为我国现代训诂学界的泰斗。他回忆说:“当年翻烂了三本《说文解字》,从此做起学问来,轻松得如庖丁解牛。”
看完这个故事,我觉得对于我们SEOer来说,《google网站质量指南》就是那本要去翻烂的书。里面那些最基本的东西,是构建整个SEO理论依据的基石。以后所有的技巧什么的都是从这些基本的东西发展而来的。下苦功夫研究完以后,就不太会有让你困惑的东西。我非常相信上文中陆宗达说的:从此做起学问来轻松得如庖丁解牛。以前我把《google网站质量指南》里的几百篇文章都翻来覆去看完以后,就有类似的感觉。
而读《google网站质量指南》,不像研究搜索引擎的基本原理一样,有很多晦涩难懂的东西。《google网站质量指南》里非常偏重于直接告诉你如何去做是最好的。下面我分析一些《google网站质量指南》里的文章,看看里面向我们展示了多少技巧。
《google网站质量指南》要从这里开始阅读:http://www.google.com/support/webmasters/
这里只是一个总的目录,以后的几百篇文章都没有一个清晰的列表,要顺着一个个的链接下去才能读完。
先来看这一篇:《我的网站在搜索方面表现不佳》 网址:
http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=34444
首先,文章一开始就讲述了搜索引擎的目标和搜索结果是怎么出来的:
我们的目标是为每个查询返回高度匹配的结果。搜索结果是通过我们的搜索索引返回的。
我们都知道搜索引擎一定会遵循为用户返回高度匹配的结果的。在谈到搜索结果是如何出来的时候,google这里用的字眼是“通过搜索索引返回的”。 “搜索索引”有一个链接,那篇文章里面解释了搜索引擎的工作流程。如果仔细看的话,会发现很多有意思的东西。如提到索引的时候,它写到:
Googlebot 会处理所抓取的每个网页,以便将其找到的所有字词和这些字词在每个网页上的位置都汇编到包含大量索引的列表中。
这里就说了建立索引的时候,关键词的位置,搜索引擎是会记录的。建议大家也看一下我的那篇《分词与索引库 》,就应该知道google其实告诉了你蛮多的知识点,如果你自己深究下去的话,是会很有收获的。
再回到《我的网站在搜索方面表现不佳》这篇文章,里面接着写到:
如果您的网站已与网络上的其他网站建立起可靠的链接,那么,我们很有可能会在下次抓取时再度添加您的网站。
用“可靠的链接”来描述优质的外部链接非常合适,其中包括了:链接你的网站的权重、链接存在的时间长久度、链接页面内容的合适度等等。
接着讲了用什么样的步骤提高你的排名。文中写到:
查看您的网站是否被 Google 编入了索引
确保 Google 能够找到并抓取您的网站
确保 Google 能够将您的网站编入索引
确保您的内容实用且具有相关性
这4点是这篇文章内容的提纲。我不知道大家看到这4点的时候看到了什么。我看到的内容是:1、2、3点说的是收录量,第4点说的是排名。而关于收录量,又分为三步:先查询网站有多少页面被收录,然后再确保有没有爬虫抓取过你的网站,最后看看网站的收录量有多少。这个步骤恰好是我优化大型网站的时候的步骤。我还会用很多的数据来查看这些方面都做到了什么程度。
看一篇文章也好,一本书也好,一定要看它的内容结构。为什么作者会那么安排内容都是有原因的。我就经常感觉我以前的文章很少有人看懂。而如果看过《搜索引擎营销-网站流量大提速》这本书的人,不知道有没有人能回想起整本书的结构,以及很多文章的结构?
在谈到“查看您的网站是否被 Google 编入了索引”这一点的时候,google写了一个简单的方法判断你的网站有没有被惩罚:
在 Google 上搜索 www.[您的域名].com。如果您的网站未出现在搜索结果中,或在搜索结果中的排名不佳,那么,这说明,您的网站可能由于违反了网站管理员指南而受到了处罚。
这里要注意的是,如果搜索你的域名,排名不佳的话也可能是你的域名受到了惩罚。
在“确保 Google 能够找到并抓取您的网站”这一项内容中,google稍微写了一下爬虫在页面上的抓取模式:
我们的抓取过程是根据网页网址的列表进行的,该列表是在之前进行的抓取过程中生成的,且用网站管理员提供的站点地图数据进行扩充。在 Googlebot 访问每个网站时,它会检测每个网页上的链接,并将这些链接添加到它要抓取的网页列表中。
搜索引擎爬虫到达了一个页面后,这个页面上的所有链接都是会收集的。但是很多链接不一定会被爬虫接着访问,而是放在一个网址列表里,等着下次来访问。至于下一次什么时候来访问,访问了是不是会被收录,就看其他因素了。这里写得不详细,所以不是很好理解。要更深入的理解整个过程,可以查看搜索引擎原理之类的书籍就可以理解了。以后我会写一下爬虫的具体访问过程,其中分为单个爬虫如何处理、多个爬虫如何协同处理的。
google还有写:
如果您最近调整了您的网站结构,或将网站移到了新的域中,那么,以前排名较高的网页现在可能会排名不佳。为避免出现这种情况,请在您的 .htaccess 文件中使用 301 重定向(”永久重定向”)来灵活地重定向用户、Googlebot 和其他信息采集软件。
这里要着重看“灵活地重定向”几个字。很多人在做301重定向的时候是不能灵活的处理的,因为他们的URL没有规划好,所以只能简单的把所有的某类URL重定向到同一个URL。其实为了保证效果,最好是用正则表达式继承前面URL的特征来跳转。另外顺便提一下,百度这样的搜索引擎对于不是用.htaccess 文件做的跳转是识别不好的。所以有些网站用PHP代码做301跳转后,百度依然不识别。
另外还写到:
即便您的网站已经编入索引,站点地图仍是向 Google 提供有关您的网站和您认为最重要网址的信息的一种方法。
这里强调了sitemap.xml文件不光是帮助收录的,更是让搜索引擎了解你的网站的。特别注意sitemap.xml文件里权重的设置。
在“确保您的内容具有相关性且实用”这一项里,写了两点平常大家不去注意的内容。如:
通过查看热门搜索查询页来了解用户到达您网站的方式。第一个列表会显示您的网站最常出现在哪些 Google 搜索中。第二个列表则显示用户通过点击哪些 Google 搜索来进入您的网站。此信息非常有用,因为它能使您深入了解用户搜索的内容(第一个列表),以及哪些搜索内容可吸引用户点击您的网站(第二个列表)。
了解 Google 查看您网站的方式。关键字页会显示其他网站链接到您网站时所使用的关键字和短语。了解其他用户查看您网站的方式可帮助您弄清如何最有效地定位您的受众。
我在《google的良苦用心:网站管理员工具 》中说过,webmaster tools里面的每一个功能都是对SEO有用的。“热门搜索查询”和“关键字”都是webmaster tools里面的功能。这里的“热门搜索查询”有一个链接,里面解释了各种数据代表什么意思以及如何应用好这个数据。看完那里的内容应该可以解决很多人的疑问。如:以前有人问我“热门搜索查询”那里显示的排名是不是不准,其实是没有理解那个排名的意思,那里的排名是过去几天的平均最高排名。 “热门搜索查询”这里虽然只提供了这么一个简单的工具,但是大家应该学会的是这个工具的一种思想。在优化很多网站的时候,有排名的关键词和实际带来流量的关键词是有差别的。那么接下来就可以做一点什么事情来改善这个情况了。
“关键字”这里就可以查看你的外部链接的语义相关性。如果能常看这个数据,很多人应该就不会去到处乱发链接了。
接下来还写了一个让你增加流量的方法:
优秀的图片内容可能是增加点击量的绝佳方法。我们建议您在发布图片时,仔细考虑如何尽可能为用户带来最佳体验并遵循我们的图片指南。
图片的SEO流量,在国外SEO流量中是能占到很高的比例的。特别是在一些B2B, B2C , C2C网站,基本能达到所有SEO流量的20%左右。“图片指南”有一个链接,里面都是告诉你如何提高图片SEO流量的方法。 和我在《怎么样去学SEO(三)》 中讲的一样,这些方法都是终极的解决方案。不过有些方法还是要你带着思考去看的。如:里面为什么要你指定所有图片的宽和高呢?不光了为网页速度,还因为搜索引擎的图片搜索结果只会返回适当大小的图片,一个只有10 x 8像素的按钮图片是不可能出现在搜索结果里的。有些东西《指南》里不能明着告诉你,但是你可以自己推测出来。
回到这篇《我的网站在搜索方面表现不佳》,文章最后还讲了两点:
您的竞争对手基本上无法破坏您网站的排名,也不可能将您的网站从我们的索引中删除。
这里顺便说一下,最应该担心的不是对手陷害你的网站,而是看自己的SEO方法有没有违反搜索引擎的质量指南。这点在百度尤为重要,因为一些SEOer觉得正常的方法,百度都列为作弊行列,很多“正常”的网站被K,如果不是百度自己系统出问题的话,都是因为作弊的原因。
我们数据中心之间的差异偶尔会导致搜索结果排名出现波动。当您执行 Google 搜索时,您的查询会被发送到 Google 数据中心以便检索搜索结果。我们有多个数据中心,决定将查询发送到哪个数据中心的因素(例如,地理位置和搜索访问量)有很多。由于我们的数据中心并不是都可以进行同步更新,因此,处理您查询的数据中心不同,所产生的搜索结果排名也可能会有所偏差。
这里已经说得非常明白了。如果去了解搜索引擎的原理,就还能发现对于搜索引擎来说,这种多数据中心有很多好处,不过一个很大的坏处就是同步数据很麻烦。但是为了给用户最好的搜索结果,这种牺牲是值得的。这里是让很多人明白,有时候排名的波动可能什么异常也没有,仅仅是你的查询被定位到了不同的数据中心。
我这篇文章篇幅太长,不一一赘述了。如果哪天我也做SEO培训的话,我也会要求培训的人员先看完这个《指南》,才能开始上课的。另外,最近太忙,有非常多的邮件和MSN上的咨询都来不及回复,望见谅。
原文地址:http://www.semyj.com/archives/951