据Bink.nu报道,一位名为Jason Dowdell的SEO专家在研究中发现,微软刚刚推出的搜索引擎可能在索引并“使用”Google的搜索结果。下面是Jason Dowdell在自己Blog中的详细阐述。
一位开发者在侦测自己的站点服务器时发现,一个特殊的IP地址――65.54.188.86在扫描他的站点,当他将这一情况反映给我时,我开始留意这个问题。该IP是微软公司在华盛顿 98052,Redmond注册的。非常奇怪的是,这一来自微软的IP不是在发送基本的头部信息(header information),而是在服务器上“摸索获取”类似于http robot名称(注:搜索机器人)或者鉴定信息甚至浏览器种类等信息。
毫无疑问,这一情况表明微软的搜索引擎正在“爬行工作”(crawling),比较特殊的是它居然在“收集”(Spidering)那些已经不存在的URL,而且是在3-5秒之间完成对一个网页的扫描工作(搜索引擎没隔一段时间会对站点部分进行扫描,而且经常来回收集没有被采集的URL)。这位不速之客从早上7:37分开始,直到晚上12点依然还在该站点服务器上“辛勤的工作”。
这个“扫描者”(crawler)的身份是:
这确实是一个匪夷所思的问题。问题的关键不仅是这个“来访者”所扫描的URL已经不存在,而且这些站点的URL只有在Google搜索引擎中使用“site:www.sitename.com”的形式才能搜索到。而微软的MSN搜索引擎不能查找到这样的结果,即使在其刚刚发布的beta版本搜索引擎中。但是仅仅在这个“来访者”离开后的数小时之内,微软的搜索引擎便可以找到同样完整的搜索结果。
一直以来,各个服务器所拥有的站点要登录以前版本的MSN搜索引擎是需要付费的,但是从最近几个月开始,微软公司开始放弃这一做法,并开始免费提供对整个Web世界的无偿检索。不过,这并是一件容易的事。所以我相信微软公司可能在自己的MSN搜索引擎中使用Google,甚至有可能的话使用Yahoo已经索引过的结果。
首先一点,这样是最简单获得合适搜索结果的方法。当然,他们可以直接到某个站点服务器上进行信息搜集工作,但是这样做的话他们将不得不做类似扫描不同URL但指向同一内容的工作。利用对Google索引结果的扫描,可以高效的解决这个问题.
此外,扫描Google索引的结果可以让新的MSN搜索引擎在内容上得到一个提升。如果你对MSN搜索引擎建立一个基本的搜索结果数字,并于六个月后再进行测试,两者加以比较,你可以更加确定他们的搜索引擎是否在搜索或查找与Google同样的链接。
当然,我的看法只是一家之言,不过这绝对是有可能的。要完成这样的工作,从技术上来讲,微软是完全可以做到的(甚至使用他们的API接口)。不过我不知道之是否合法,如果事情真如我所言,Google公司的律师也许会有更多的表示来针对这样的“公平竞争”(fair game)。