央广网

科技频道 > 互联网

央广网

神经机器翻译系统上线500天 百度的英文说得越来越溜

2016-11-18 15:13:00 来源:中国网

  去年5月,百度率先将基于神经网络的机器翻译(Neural Machine Translation,简称NMT)纳入百度翻译中,推出全球首个基于深度学习的在线翻译系统。

  这个系统有多厉害呢?简单来说,从前翻译系统是将一句话拆分成单词或者词组进行翻译,这样的翻译结果往往会导致语句不通,出现各种闹笑话的“中式英语”。

  而上线了NMT系统后,机器翻译会将一句话视为整体进行解码,可以很好地利用上下文信息,获得更为流畅的译文。譬如,“给你点颜色看看”这句话,不具备NMT系统或技术不够完善的机器翻译往往会将其译为“Give you some color to see see”,而上线了NMT系统的百度翻译则可以非常地道地向老外讲出汉语语境中“颜色”的深意了。

  一番试验下来,无论是类似“我的电脑有点卡”的口语化表达,还是“萝卜青菜各有所爱”类似的俗语,以及“温故而知新”等论语名句和“欲穷千里目更上一层楼”这样的古典诗词,有了NMT系统,百度翻译的汉译英水平提升显著。

  不过,尽管现如今NMT的强大技术加持让普通用户和资深译员都欣喜万分,在500天前,上不上线它还是一件让工程师们颇为头疼的事情。“去年初国际上NMT的研究刚起步不久,一方面大部分的研究人员、业内专家对于NMT技术还持观望甚至怀疑的态度,另一方面NMT自身存在的一些缺陷导致其无法达到线上实用的状态。”百度翻译技术人员表示,那时包括百度、Google在内的互联网公司所使用的基于短语的统计机器翻译(SMT)方法,已经沿用十多年,也有不错的效果。考虑以上因素,要不要上线NMT系统,对于百度翻译团队来说是一个艰难且需要勇气的抉择。

  不过最终,百度还是决定做“第一个吃螃蟹”的翻译系统,在中英、中日、中韩等多个语种互译上线NMT系统,并凭借顶尖的翻译技术和出色的语言处理能力成功斩获国家科技进步二等奖,随后在业内引发NMT研究热潮。

  那么,对中译英研究如此透彻的百度翻译是否可以比肩字幕组了呢?当面临更为情景化的现实生活场景时,机器翻译要理解的可不仅仅是上下文,有时候还面临着前后一整段话的考验,甚至需要识别说话的当事人。

  (故事背景是翻箱倒柜之后找出了《魔戒》同款打造的戒指,这对于极客的意义你懂得,于是nerdy有了不一样的意思)

  不过,这在未来并不是不可实现的,在百度翻译全新上线的拍照翻译功能中,便已经开始涉及“实物翻译”,通过读图,在识别图中元素的基础上实现翻译。未来的某一天,或许我们再也不必啃“生肉”,只需要打开百度翻译,它便能够认出剧中角色,并且译出符合主人公个性的话。

  总而言之,NMT系统的上线,带给了百度翻译全新的想象空间,随着语音识别、图片识别等人工智能技术的进一步提高,未来,行走异国他乡,百度一下,便能拥有翻译专家相伴随行。

编辑:殷雨婷

关键词:机器翻译;系统上线;NMT;中式英语;颜色

说两句

相关阅读

机器翻译会是人力翻译的终结者吗?

”  李向玉想到的办法就是大力推广机器翻译,以应对天量的语言交流需求。中葡英机器翻译实验室会首次在机器翻译方面尝试使用“计算机神经网络算法”,而语言学家的加盟可以让这项技术得以完善。

2016-07-27 17:05:00

大数据无法取代人工

机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。

2014-07-16 07:36:00

让机器会“说”多种语言

针对研究信息抽取、问答系统、情感分类等方面的技术研究,他们的目标主要是提高个性化信息服务的质量。几乎所有用户都希望自己的问题能够随时得到回答,希望有一个系统能够自动把他们需要的知识或答案抽取出来,如大百科知识自动问答系统一般。

2013-12-24 11:50:41

参与讨论

我想说

编辑推荐

视觉焦点

推荐视频

央广网官方微信

手机央广网

点击排行

违法和不良信息举报电话:010-56807188 新闻热线:4008000088 E-mail:4008000088@cnr.cn
网上传播视听节目许可证号 0102002 京ICP证150508号 京公网安备11040202120007
中央人民广播电台介绍 | 央广网介绍