“微软”二字已经不单单代表着一个软件公司,它更像是一个技术和人才交相辉映的时代的象征。从2009年1月5日起,《互联网周刊》将连续推出针对微软亚洲研究院的系列报道,带领读者领略微软的技术创新,寻找微软的企业文化,挖掘微软亚洲研究院背后的故事。
微软教你作英文
在垂直搜索领域,微软始终保持着奔跑的姿态:借助英库(Engkoo),传统的在线词典模式被突破。
本刊记者 马荟
“毫不夸张地说,我对英库渴望已久。”微软亚洲研究院自然计算组副研究员刘晓华在采访快结束时才对记者说了一句很“私人”的感受。“我是一个中国人,在微软亚洲研究院,我的日常语言变成了英语,日常口头交流还好说,但是发邮件、演示PPT、写研究论文就需要精益求精。这样特定的角色就要求我像美国人一样写出纯正、地道的英文来。”
坐在刘晓华身边的Matthew Scott挂着夏威夷阳光般亲切的笑容,这个来自纽约的小伙子是微软亚洲研究院技术转化组软件开发工程师,同时,也是英库项目的负责人,Matthew Scott现在还听不懂刘晓华和记者之间的中文对话。对于一个不懂汉语的外国人,却在负责一个用来帮助中国人写英文的垂直搜索引擎的疑惑,记者很快释然了。因为从Matthew Scott的微笑中感受到的是他与这个全球性的跨国企业相似的表情:充满“亲和力”的本地化创新。
微软作为一名后来新兵在纷繁的在线词典市场,从帮助国人写好英文文章的角度,选择了与谷歌、网易有道词典、爱词霸完全不同的开始。
希格玛的地道英腔
英库在线英语工具(www.engkoo.com)本质上是一个帮助中国人学习英语的垂直搜索引擎。与微软亚洲研究院的有些研究成果相似,英库的诞生是微软亚洲研究院研究员们的无数次冒险和尝试之一。“开始的想法也并不在于商业上的应用,而是流传在研究院内部的一个有用的小工具。”Matthew Scott对记者说。
英库凝结了包括创新工程组、语音组、用户界面组、机器学习组等不同领域的研究团队的集体的智慧,而微软亚洲研究院的研究员们就成了英库第一批使用者。
英库融合了包括微软Office词典、电子百科全书等十余部经过授权的专业词典,通过对整个互联网的网页进行分析,抽取、整理获得数量巨大不断更新的双语例句和短语,再利用自然语言计算、统计机器学习等技术对双语例句做了自动分类、质量分析、相关度排序、语法分析等处理,在此基础之上构建了基于语言学特征的高维索引,从而提供了超越关键词的新的检索体验。
经过了无数次的改进,英库经受住了希格玛大厦里这群“最聪明”人的挑剔和“找茬”。在去年11月微软亚洲研究院“创新日”活动上,英库和其它展出的四十多项创新成果首次亮相就吸引了众人目光。
“也许别的在线词典的搜索功能已经很完善,但是英库着实为用户着想,不仅词库完整,更注重用户的体验以及操作的便捷。我相信英库一定会在将来成为最受欢迎的在线词典之一。”北京理工大学微软技术俱乐部王维在看过技术演示后说。