很长时间以来,由于网络搜索市场存在着过于强大的垄断厂商,因此拥有创新技术的初创企业在这里难以找到成长的空间。但如今业内风险资本投资、产品开发、企业收购等活动络绎不绝,这一切标志着搜索界即将进入新的纪元,而术业有专攻的搜索厂商们也将大展拳脚。
根据研究机构尼尔森在线公司(Nielsen Online)的数据,领头的谷歌公司(Google,下称谷歌)囊括了62%的网络搜索查询量,而雅虎公司(Yahoo,下称雅虎)和微软公司(Microsoft,下称微软)则屈居其后。排在这三巨头之后的,是众多的业界新贵,它们推出了各种面向消费者的网络搜索,包括新型语义(semantic Web)和语境(contextual)网络搜索服务、移动搜索以及通过其他形式呈现搜索结果(比如在NewsGator RSS阅读器里显示结果)的服务。
过去12个月中发生的一连串事件,使得被少数几家巨头统治的搜索市场,看上去像是进入了群雄割据的争霸时期:
·去年年底,由一群欧洲科学家于2004年成立的语义网搜索引擎哈基亚公司(Hakia)推出了“社交搜索”功能,旨在为用户找到趣味相投的人牵线搭桥。今年1月,该公司得到了500万美元的追加投资,总投资额累计达2,100万美元。
·今年1月,语境搜索专家Silobreaker公司推出了具备关系匹配(relations-mapping)功能的新型引擎,它可以对主题和大众行为进行趋势分析。
·不久之后,初创企业冲浪峡公司(Surf Canyon)发布了名为探索引擎(Discovery Engine)的浏览器插件,它能够实时消除主流引擎搜索结果中存在的歧义。换句话说,它可以根据相关性将搜索结果重新排序。
·3月,搜我公司(SearchMe)推出了“可视化搜索”功能,对非文字型搜索提供了分类建议。这个已经成立3年的公司今年又得到了1,600万美元的风险投资,加上先前红杉资本公司(Sequoia Capital)和雷曼兄弟公司(Lehman Brothers)的投资,总投资额累计已达3,100万美元。
·5月,别出心裁的“白话英语”搜索引擎Ask.com宣布将收购旗下拥有Dictionary.com和Thesaurus.com两家网站的Lexico公司。
·6月,搜索结果整合商Viewzi公司推出了新工具,能将主流搜索引擎的搜索结果用新颖、友好的界面呈现出来。
·7月,初创企业Cuil公司正式启动,这家由两位前谷歌员工创立的公司声称要搜索到比谷歌还多的海量网页。
对企业用户来说,普通的谷歌搜索会带来冗余的信息,而新搜索技术的繁荣可能会解决这一日益加剧的问题。冲浪峡公司的创始人马克•克莱默(Mark Cramer)说,对于那些本身工作离不开搜索的网络用户们而言,“他们不仅仅是在网络上进行随意的探索和体验,他们有着具体的目标,而且需要在短时间内找到这一目标。”
搜索界三巨头当然不会坐以待毙。今年7月,雅虎发布了名为Yahoo Search Boss的网络服务平台,程序开发商可用雅虎的应用编程接口(API)作为基础,创建出能与雅虎搜索引擎相媲美的新型搜索工具。与此同时,微软也宣布了收购语义搜索专业厂商Powerset公司,目的是增强Live Search的性能。
谷歌则继续推进自己的宏伟计划。谷歌的搜索大师们在相关采访中曾表示过,公司正将165亿美元年收入中的相当大一部分,投入到搜索工具的改进及推广上。然而,谷歌的战线铺得实在是太长了:它不仅在推广移动设备操作系统Android,还推出了Chrome浏览器与Internet Explorer竞争,并且又在进军云计算(cloud computing)领域。除此之外,谷歌也在加大投入进行企业级搜索研发,并尝试围绕清洁的可再生能源开拓出一个全新的行业。
谷歌的研发项目排得满满当当,虽说该公司市值达到1,460亿美元,但这么多项目也让它疲于奔命了。和以前许多IT巨头一样,谷歌可能无法专注于核心业务,从而错过下一波的创新大潮。搜索引擎不再千篇一律
所有这些研发活动说明了什么问题呢?正如专题网站“搜索引擎地带”(Search Engine Land)的总编丹尼.沙利文(Danny Sullivan)所说的,我们正在进入“搜索3.0时代”。沙利文将“搜索1.0时代”定义为上世纪90年代后期,当时AltaVista、Excite、HotBot、Infoseek、Lycos和WebCrawler等群雄并起。不过,这些引擎都是利用简单的文本搜索标准来查找和排名网页。比如说,如果你搜索“Nerf ball”,你将会得到许多同时包含“Nerf”和“ball”这两个单词,并且单词靠得非常近的网页。然而,市场营销人员破译了这些网页爬虫(Web crawler)的运作机理,开发出了相应的欺诈策略并迅速传播开来。结果,这种粗放型的搜索方式不再有效了。
“搜索2.0时代”(即谷歌时代)由此诞生了。谷歌的“网页排名”(PageRank)系统摒弃了简单的文本搜索方法,使用了先进算法对网页进行排名,通过分析网页上人工生成的链接结构来决定网页的相关重要性,链接到某一特定网页的链接数量和质量是排名的主要依据。该方法是目前网络搜索的主流形式,对相当多的人来说,这种方法收效不错。
不过,随着越来越多的人意识到谷歌网页排名系统的局限性,“搜索3.0时代”开始萌芽:搜索引擎将垂直的搜索结果与谷歌或微软的LiveSearch等主流引擎所提供的横向跨网页搜索结果有机地整合到一起。
面对新时代的来临,谷歌自然也有自己的计划,但最让人感兴趣的还是那些初创企业所开发的新工具,这些工具能做主流引擎所不能做的事。
今年1月,在加州棕榈沙漠(Palm Desert)举行的演示会上,搜索与关联分析(relational-analysis)供应商Silobreaker公司的CEO克里斯托弗•曼森(Kristofer Mansson)就宣称,Silobreaker引擎“能分析网页内容的语义和语境”。
Silobreaker对追踪新闻人物和当前热点事件特别有效。它提供的搜索结果中包含了一些很有用的东西,比如说语境提取(某人或某主题是如何与其他人、机构或分类发生关联的)、绘图、趋势跟踪(世界各媒体中提到的总次数以图形方式显示出来)以及关系匹配等。该搜索引擎以10,000家新闻、博客、研究和多媒体网站作为数据来源,将有关全球性问题、科学、技术和商业等方面的内容进行整合。
目前,Silobreaker正以免费网络工具的形式进行推广。曼森已经看到了该引擎在大型企业和政府机构(包括情报机构)中的应用机会。该公司的业务开发总监马茨•比约勒(Mats Bjore)曾帮助瑞典军方设立开源的情报研究项目。
Silobreaker最酷的功能莫过于关系匹配了。该功能可以将与搜索主题词紧密关联的人或主题用图形的形式显示出来。通过操纵图中的节点,你可以看到两个兴趣点是如何相互关联的。你只需点击两个节点连线的中点,就可阅读解释两者关联性的文章或内容。
企业可以利用Silobreaker来追踪市场趋势,将新闻事件与其产品或所在行业进行关联匹配,还可追踪竞争对手公司高管间的联系、他们以前所在的公司以及业界发展动态。曼森预计,Silobreaker公司未来将与内容出版商或各行业的领先企业合作,开发具有高度针对性的工具,其主题可以是燃料电池、衍生品交易票据或纳米技术等,搜索结果既包含收费内容,也有普通的网页。
和谷歌的通用搜索(Universal Search)在同一个月推出的Mahalo是个复古型的搜索引擎,它通过人工编辑的方式将自动化的搜索结果进行筛选。Mahalo公司是由前IT博客作者贾森•卡尼斯(Jason Calacanis)所创建的,它借鉴了维基百科的社区生成内容方式,以改善搜索结果的品质。如果用该引擎搜索“帕布罗•毕加索”(Pablo Picasso),你得到的搜索结果将是一段毕加索的生平简介,外加排名头7位的网页,以及通往毕加索在线作品和相关视频的链接。不过,即便Mahalo公司的目标只是弥补谷歌的不足而非取而代之,利用编辑人员来筛选庞大的网络信息也是项非常艰巨任务。以媒体为中心的搜索
一些新型的搜索引擎公司正致力于研究如何通过不同形式来呈现搜索结果。今年6月推出的可视化搜索引擎Viewzi可以根据客户想要搜索的内容类型,将结果以不同的视图选项呈现。比如说,如果你在找一段视频,你就会看到来自YouTube、Veoh等网站的视频片段。在Viewzi的搜索结果中,网页是以缩略图而非文字链接的形式显示。Viewzi还采用浮云一般的三维界面来显示网站与其他相关网页之间的关联。Viewzi公司的乔万尼•加卢奇(Giovanni Gallucci)表示:“我们在规模上超越不了谷歌,所以我们将重点放在了如何重塑搜索结果,而不是重新发明搜索引擎上。”
这一方式意味着利用主流引擎得到搜索结果,但是以更富有创意的模式呈现结果。对商业客户而言,最具吸引力的是Viewzi掌握用户喜好的能力:系统能回顾用户的搜索历史,查看用户选择了什么结果、选择如何显示结果以及用户如何与结果进行互动。因此,假如你经常搜寻企鹅在自然栖息地的照片,Viewzi的搜索结果将提供与水禽相关的内容,而不是显示与匹兹堡企鹅曲棍球队相关的内容。“我们的引擎能够记忆和领悟用户的个人偏好,所以它可以说是为你的特定需求度身打造的。”加卢奇表示。
已经创立4年的Rollyo公司提供了更为个性化的搜索引擎,它可以让人们将多达25个网站捆绑起来,揉合出适合自己需求的搜索引擎。用户可以创建自定义的搜索工具,并通过Rollyo提供的接口与他人分享。谷歌的自定义搜索引擎也提供了类似功能,但尚未被广泛应用。
除了以上这些技术外,还有针对特定用户群体的搜索引擎,比如Quintura Kids搜索引擎就使用了“云搜索”(cloud search)功能,为孩子们提供各种层次的标签,让他们不用输入词组查询,就能迅速跳到相关的子类别,比如说《小查和寇弟的顶级生活》(The Suite Life Of Zack & Cody)或者《孟汉娜》(Hannah Montan)等热门儿童剧。
最后,我们还可看到一些根本算不上搜索引擎的新工具。这些工具通常会被内嵌到其他类型的应用程序中。2月份推出的冲浪峡工具就是个浏览器扩展程序,它的“实时隐含语义个性化”(semantic real-time implicit personalization)功能可以将主流搜索引擎的搜索结果进行再排序,将最具相关性的结果排到最前面。冲浪峡工具密切注视并学习用户的行为信号(behavior signal),计算出“瞬时相关性”(instantaneous relevancies),以便从海量的搜索结果中过滤出最有用的少数结果。
初创公司Jodange在今年9月推出的工具Top of Mind也是其中之一。该工具能够追踪那些舆论领袖的认知价值。Jodange公司的技术可以识别在特定议题上拥有影响力的人物,监测他们的观点如何随时间的推移而转变,以及他们如何推动媒体及公众的情绪变化。该公司创始人兼CEO拉里•利维(Larry Levy)在www.jodange.com网站上提供了免费版本供人下载使用,但对于那些想跟踪“某位知名人士对己方市场和竞争对手做出过何种评价”的企业,他也计划推出相应的订阅服务。
“长期以来,我们一直被迫使用关键词搜索这种不太有效的手段。”利维说,“如今语义网搜索等新工具可以追踪锁定人们最感兴趣的话题,并将相关信息提供给人们。这种能力是建立在我们充分了解用户的知识范围、观点和兴趣的基础之上的。”
企业用户总是不懈追求生产率优势,多年来它们一直期盼获得理想的搜索工具。冲浪峡公司CEO马克•克莱默在谈到公司的工具时说:“和其他许多创新一样,这个概念是从无数次的挫折和失望中诞生的。”
当各种利基产品挤入主流工具的地盘并占据一席之地时,那人们要抱怨的恐怕就不是主流搜索引擎的种种缺憾了。根据不同的搜索需求,他们不得不在不同的工具之间不断切换,这或许又会成为人们满腹牢骚的根源。不过话又说回来,如果新的搜索技术能够更好地帮助我们找到所需信息,那这种副作用我们应该能够接受。