MT Summit X
September 12-16, 2005
Phuket, Thailand
The tenth Machine Translation Summit, organized by the Asia-Pacific Association for Machine Translation (AAMT), will be held at Phuket Island, Thailand in September 2005.
李老师,赵老师于9.12-9.16参加了在泰国普及島举办的MT summit x峰会。9-19下午两点,也就是今天下午,赵老师给实验室的学生们讲了他参会的感受,以下是我听完赵老师感受后的一些感受。
MT summit 至今已举办十届,由美国、欧洲、亚洲三方轮流主办。本届在亚洲,举办者为AAMT,其实就是清一色日本人。世界上在MT方面的研究劲旅主要是:老美、欧洲、日本。
1 会议概况:
据赵老师介绍会议的规模还算大, 超过200人注册。会议日程 – 每天上下午各有1~2个特邀报告,此外还有3个研讨会(Panel),分组报告安排得较为松散。特邀报告共有10个报告,其中来自中国4个。从此也可以看出作为主办方的日本对中国的重视。
2特邀报告:
本次大会是中国研究人员向世界介绍我们研发活动的一次盛会:
刘伟权博士介绍北京奥运会多语信息服务系统与MT引擎
刘群博士介绍863MT评测情况
徐波教授介绍中国SMT研究概况和相应的Workshop
黄河燕教授介绍中国商业MT系统的研发
在这些特邀报告中屡次提及哈工大。
从上面的信息中可以看出,刘伟权博士是08奥运信息服务的负责人,而刘群是以前就很熟悉的研究者,才知道他就是负责863评测的。徐波这个人要注意一下,徐是863专家,在自动化所是高新科技转化的负责人,而且他对MT的前景很乐观,特别是他有志于在SMT方面做出点事业来。黄河燕教授是中科院计算所下属华建公司的负责人同时是中科院计算所的教授博导。
几个特邀报告
中国大陆比较全面地介绍我们的研发现状(关于奥运项目、863评测、SMT Workshop等)
德国教授Hermann Ney演示了口语翻译系统用于欧洲议会法英现场翻译的情况(TC-Star项目), 其中一个视频资料显示在会议现场使用的情况已经基本实用。
从整个会议看,SMT居于支配地位
3 Demo:
参展单位 :
日本5家(NICT,ATR, Fujitsu,OKI,Toshiba)
泰国2家(TCL,NECTEC)
中国2家(CASIA, HIT)
德国1家(DFKI)
赵老师认为总体上反响不很热烈,ATR的语音翻译多人试用,其他较冷清。比较相关的是,Prof. Nagao参观并提问我们的EBMT系统。比如实例如何匹配,实例库如何存放、建设等等问题。赫赫,有点意思,看来我们以后一定要多多找机会"班门弄斧"一下,也好得到些宝贵建议。
值得一提的是Fujitsu由于老师带队,而Toshiba则由王海峰博士领衔,王他们参展的系统包括J-E,E-J,E-C,其中E-C系统是由王一手组织研发的。其中王用RBMT系统翻译的一个关于介绍纽约的网站的DEMO感觉非常棒了,不过两年前DEMO的也是同样水平。:D
对于用户方面,赵老师作了如下总结:
使用者对于机器翻译系统总的需求不减,用途多样化
手机厂商Nokia了解手机翻译的可能性
泰国一家公司对中泰语言互译感兴趣,集中在旅游和商务
多语信息处理资源受到重视
美国MITRE公司/日本NiCT收集资源信息
MITRE公司隶属于TIDES计划,公司人员对参加会议的人员都认真记录了情况。
4 会议论文集情况 :
– 41 presentation / 22 posters
分布 –
Resource 6
User study 3 / Practical system 6 / Localization 2
SMT 3 / Corpus-based MT 3 / Methodology 6
Evaluation 2 / Analysis 3 / Speech3
5 会议整体感受(赵)
乐观估计-MT系统即将实用化的前夜 / SMT备受瞩目
欧美、日本再掀研发高潮
国内一些单位正准备奋力一搏(e.g.自动化所,徐波)
应用和系统互动-北京奥运项目,多种技术结合(通讯,多媒体…)
对我们MT研发情况的反省:
我们面临着压力挑战,也存在机会
MT研发滑坡,重视不够
缺乏长期的部署和得力的编程实现
借鉴多年的积累,能否在今后一年半改进或重整我们MT系统框架
以系统为研究平台,掌握最新技术,不能处于研究圈子之外
MT技术离不开MT系统
DEMO系统 - 研究平台
评测推进系统改进
在没有明确的应用之前,参加评测是主要推动
深入分析系统问题,实验改进,探索新方法,发表高水平论文
调整整合我们的MT研究部署
MT涉及的问题多,把人力集中到一个系统中(如果可能的话)
相关技术和工具有步骤地改进
加强算法研究和错误分析,有针对性地创新
攻关与长期、有步骤的计划结合
技术实现上的一点想法
统计框架,短语翻译为核心(自动化所系统、Och/Ney报告、Panel讨论等均论及此)
SMT借鉴或融合EBMT思想(SMT and EBMT astonishingly separate research communities - Och)
一些技术的应用 – 短语对齐、单语chunking、语言模型等
知难而进,发奋图强,迎头赶上
目标 – 跻身国内汉英-英汉机器翻译评测结果最好单位之列(BLEU/NIST评分相差不多) / 国内外圈子里始终有我们的声音
我们还有机会!
侧记: 杨老师在会后发表了一下他自己的感觉,他认为在MT界现在英雄的作用何其之大,以Och对于ISI的作用为例,并提出问题谁会是中国的Och.