北京时间10月18日消息,据国外媒体报道,虽然很多人都认为谷歌在搜索领域的优势无人能敌,但是事实上,他们同样会碰到许多棘手的问题,尤其是在处理公司内部数据时,更是需要投入非常大的精力。
谷歌公司的工程副总裁尤迪-曼博尔(Udi Manber)在卡内基梅隆大学硅谷校区发表演讲时表示,对谷歌公司目前所面临的几个难题进行了阐述。
曼博尔表示,谷歌的搜索已经家喻户晓,并且已经成为大多数互联网用户寻找信息的工具。但是他同时也说道:“当你想要在公司的系统中寻找信息的时候就没有那么容易了。因为你需要对七八个拥有不同接口的地方进行搜索。”不过,谷歌自己却已经开发出了一套对公司信息进行搜索的工具。曼博尔表示,谷歌已经开始在公司内部部署这套工具,不过这套工具仍然有待提升。他说:“这款产品还不完善。我并不是很满意。”
企业搜索长期以来都被看作是搜索巨头利用其搜索技术为企业客户提供服务并赚取利润的重要途径。但是这却并不是件容易的事情,因为要通过企业搜索工具获得正确的结果,就需要对多种完全不同的系统和文档格式进行检索,同时也要考虑到不同的访问权限。例如,公司的工资表和尚未发布的产品技术资料的访问权限就被限制得非常严格。
谷歌目前已经成立了一个与其google.com公共搜索相独立的企业搜索集团,他们提供有一整套基于“谷歌搜索服务器”(Google Search Appliance,GSA)的产品线。通过这些产品,用户就可以对企业网络内的文档进行检索。
但是,在最近的一次采访中,美国市场研究公司IDC的企业搜索分析师苏伊-费尔德曼(Sue Feldman)却表示,虽然谷歌用于衡量网页重要性和相关性的PageRank在公共搜索中非常有效,但是对企业用户却未必如此。他说:“如果没有互联网上的大量点击作为基础,PageRank就无法达到理想的效果。因此,据此做出的公司文档的排序难以满足用户的需求。” 费尔德曼随后还补充道,虽然谷歌搜索服务器是基于PageRank进行排序的,但是他并不清楚谷歌内部所使用的搜索工具的工作原理。
搜索相关性
谷歌搜索服务器的产品经理尼廷-麦克特尼(Nitin Mangtani)表示,他们最近对谷歌搜索服务器进行的软件升级提高了结果的相关性。例如,当用户搜索“Apple(苹果)”时,就会出现两组结果,一组是关于苹果公司的,另外一组则是关于苹果这种水果的,用户则可以从这两组结果中进行选择。麦克特尼说:“归根到底,搜索引擎的工作就是为人们提供最为相关的结果。”
在卡内基梅隆大学组织的演讲中,美国企业搜索工具供应商Openwater Networks的联合创始人蒂莫西-周(Timothy Chou)表示,企业搜索需要更为高级的解决方案。他引用了雪佛龙(Chevron)公司首席信息官的话说,公司每天创造的信息都相当于美国国会图书馆的信息容量。他说:“消费级的网页的总容量大概100TB,而企业的数据库容量则有可能达到这一数字的好几倍。”
医药巨头瑞士罗氏制药公司(Roche)的首席信息官戴夫-霍奇森(Dave Hodgson)表示,他对FAST公司的企业搜索系统非常满意。而FAST最近刚刚被微软以12亿美元的价格收购。霍奇森表示:“(FAST)的排序非常合理,不过它并没有充分考虑到用户的身份和目的。在实际应用中,人们更需要根据用户的特点来提供搜索结果。没有人希望看到千篇一律的企业搜索。”