首页 > 人工智能 > 正文

人工智能翻译发展到哪一步了?

2019-03-21 14:18:30  来源:大数据文摘

摘要:机器翻译一直是人工智能领域的一大课题。1954年美国乔治亚大学和IBM公司合作的俄英机器翻译,被认为是世界上第一个机器翻译实验。不过,中国早在1956年就把机器翻译列入了全国科学工作发展规划。1957年,中科院语言研究所和计算技术研究所开展了俄汉机器翻译实验。
关键词: 人工智能
  想一下未来50年或者100年,您的孙子或者孙子的孙子,是否还会花费人生中十几年甚至几十年的时间学习一门外语,甚至还学不好?
 
  当然,雇翻译也可以,可往往花费不菲。有这样一批计算科学家、工程师,他们相信可以有别样法门,那就是用机器来做翻译。公平地说,他们已经部分取得了成功。
 
  微软亚洲研究院副院长周明做机器翻译已经有30多年,见证了这一领域的面貌变迁。大概去年的这个时候,微软亚洲研究院和微软雷德蒙研究院合作在通用新闻报道测试集WMT2017的中英翻译测试集上,达到了可与人工翻译媲美的水平。
 
  在机器翻译中,测试集就像是给跳高运动员设置的横杆,各家机器翻译的结果和这个标准比较,越接近就意味着越好。
 
  事实上,机器翻译一直是人工智能领域的一大课题。1954年美国乔治亚大学和IBM公司合作的俄英机器翻译,被认为是世界上第一个机器翻译实验。不过,中国早在1956年就把机器翻译列入了全国科学工作发展规划。1957年,中科院语言研究所和计算技术研究所开展了俄汉机器翻译实验。
 
  1989年,周明在哈尔滨工业大学计算机系李生老师指导下读研时,研发的CEMT中英翻译系统通过了当时的航天部的技术鉴定。当时,国内有几家在做英中机器翻译的研究,但是做中英机器翻译的非常少。CEMT应该是中国最早的中英机器翻译系统,而国外中英机器翻译研究也寥若晨星。
 
  那时的中国正逐步告别封闭,走在改革开放的道路上,人们迫切希望用英中翻译把浩如烟海的英文文献翻译成中文。那个时候,周明已经意识到,有一天将中文翻译成英文也同样重要,于是他选择了从当时冷门的中英机器翻译开始研究。
 
  彼时,没有互联网,也没有什么参考书,周明自己设计了这套中英翻译系统。这也是那个闭塞年代的无奈——几乎没有任何可供参考的文献,能看到的就是通过北京图书馆和有关部委情报所得到的一些胶片,大概相当于国外六七十年代水平的文献。
 
  这套可说是世界上第一个公开发表的完整的中英翻译系统,背后依据的是一套完整的规则体系(比如中文句法分析规则、中文句法转换成英文句法的转换规则、英文形态生成规则等等)。
 
  这样的一套系统,可以把当时很流行的一本英语学习读物《英语900句》很好的翻译了出来。之后,这套系统于1990年还获得了原航天部科技进步二等奖。
 
  1991年博士毕业后,周明进入了清华大学做博士后。在张钹、黄昌宁两位教授指导下,从事中文句法分析研究。试图通过中文句法分析的提高,逐步改进中英翻译。
 
  90年代的中国,与世界的交互逐渐增多。黄昌宁老师把他从国外参加会议带回的会议文献整整齐齐地放在一个书柜里,可见有多爱惜。很多外校的老师和同学到清华来都要借阅这些文献。
 
  也正是从黄昌宁老师那里,周明得知国际学术界已经开始基于统计模型来构建机器翻译系统。之后,周明就做了一个基于统计的中文句法分析器。
 
  除了中英翻译系统,周明也做过中日翻译系统。那是他1996至1999年在日本高电社访问的时候,当时担任中文翻译室室主任的他领导开发了名为“J北京”的中日翻译系统,其中J的意思是日语。
 
  这也是一个基于规则的翻译系统,利用中日两种语言的对比分析,对句式进行变化,并生成日语的形态。基于同样原理,后来也实现了日中翻译。J-北京是日本最为有名的中日翻译软件,在市场上获得了成功,甚至在今天还有出售。
 
  1999年从日本回国后不久,周明加入到刚成立不久的微软亚洲研究院,在黄昌宁教授领导的自然语言计算组担任研究员。周明一开始做了中日文输入法、微软对联、基于实例的机器翻译、英语写作辅助系统等等。到2005年,在时任副院长洪小文的支持下,他们组开始做统计机器翻译系统。
 
  2012年,在天津举办的“21世纪的计算”研讨会中,周明团队与语音组的同事合作,将微软全球首席研究官里克·雷斯特博士的演讲由英文实时翻译成中文。这个工作包括了三个部分,首先将里克的演讲通过语音识别得到文本,然后再通过统计机器翻译将英文文本翻译成中文,最后通过语音合成模拟里克的发音特点读出中文的翻译。
 
  2015年,人工智能进入到神经网络兴起的时代。先是在图像领域,继之是语音识别,研究人员应用深度神经网络都取得了不俗的效果。也就是在那个时候,周明他们也开始用深度学习来做机器翻译。
 
  一开始神经网络机器翻译的效果很差,但随着各个公司、学校不断完善技术,如今,机器翻译的水平已经在单句级别,如果有充足语料训练的情况下,可达到和人类平均水平几乎相仿的水平。
 
  也就是说,如果你是英语四级或六级的水平,同样翻几句话,现在的机器翻译有可能比人要翻的好。

第三十八届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:kongwen

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。