首页 > 互联网 > >内容页

百度攻克AI同传翻译难题 可实现两种语言“即时互译”

2018-10-24 15:33:48 来源:望潮科技

不久之前,同传AI刚刚在国内掀起暴风雨,以至于让大众认为现阶段的AI技术尚未达到企业宣传的程度。

不过,近日,百度于硅谷宣布了最新重大突破,即一个名为STACL的同传AI,其论文结果优异,Demo的效果也很惊人。并且,MIT科技评论、IEEE Spectrum等一众外媒,还纷纷给出好评。

攻克AI同传翻译难题众所周知,在AI领域,两种语言的“即时互译”是一项难以攻克的技术问题,之所以如此,是在于源语言和目标语言之间存在较大的词序和语序的差异。

百度STACL同传AI则解决了这一难题。

据百度方面介绍,STACL具备了预测能力和可控延迟的即时机器翻译系统,其可实现两种语言之间的高质量、低延时翻译。

那STACL翻译能达到什么程度?IEEE Spectrum在采访之后给出了类比:跟联合国会议里的人类同传相媲美。

如果真是如此,那百度AI同传相比其他同类产品的突破确实是蛮大的。

从百度展示的Demo来看,STACL不走“整句说完再翻译”的路线,甚至还会预测发言者未来几秒的内容,其翻译工作延时非常短,与原句只差几个字。

虽说这个AI目前只是同步翻译成文字,还没有合成译文的语音,但这不是重点。关键是,不知道有没有注意到,这种“只差几个字”有多难得。

在Demo中,还没等“美国总统布什与俄罗斯总统普京在莫斯科会晤。”这句汉语说到莫斯科,自动翻译的英语已经出现了“meet”,也就是汉语句末的“会晤”。

事实上,我们可以看出,这个“meet”,是AI从前半句话里脑补出来的,依据的是美国总统最可能与其他人发生怎样的活动。

因此,百度这个同传AI,不用等一句话说完,就能开始翻译了。

预测即时翻译能力从何而来?为了能够让STACL拥有预测和即时翻译能力,百度开发人员从人类译员身上获得启示,从而研发了“wait-k words”模型,该模型可以根据历史信息,直接预测翻译中目标语言词汇。

此外,该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。

比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。

图:百度AI同传技术研究论文,地址https://arxiv.org/abs/1810.08398

据悉,为此,百度把它和两个翻译模型结合起来做了实验,一个是比较早期的RNN翻译模型,另一个是Google在2017年推出即大热的Transformer。

不过,wait-k不仅仅适用于这两个模型,而是可以用在任何序列映射(sequence-to-sequence)模型上。也就是说,只要有个模型能搞定两种语言之间的翻译,加上这个wait-k做一点小改造,就能实现同传了。

一个机器翻译系统,离不开分析输入语言的编码器和输出目标语言的解码器,而wait-k对机器翻译模型所做的小改动,就在解码器上。它让解码器在输出内容的同时,能预测编码器还没有输入的东西。

百度的“一揽子”解决方案在同传领域,百度除了推出同传AI产品外,还联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。

相比人类译员,机器最大的优势就是不会因为疲倦而导致译出率下降,这也使得机器的译出率可达到100%,远高于人类译员的60%-70%,同时,在价格上也占有优势。

然而,在翻译正确率上,现阶段的机器同传却有点一言难尽。

为此,百度联合在语音识别方面,区别于传统的上下文相关的建模技术,提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。据介绍,该方法具有泛化性能好、中英文混合识别等特点。

在翻译质量方面,百度还提出了“语音容错”的对抗训练翻译模型,该模型可根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,从而使得模型在接收到错误的语音识别结果时,也能够在译文中纠正过来。

如,语音识别系统将“大堂”错误的识别为“大唐”,这一对噪声词将被自动收录到训练数据中,并将源语言句子“我们在酒店大唐见面吧”替换为“我们在酒店大堂见面吧”,而保持目标语言翻译不变“Let's meet at the lobby of the hotel”,同时将这两个中文句子用于训练,进而获得具有更强的容错能力模型。

此外,如前文所言,百度在降低延时并提升翻译质量方面,研发出了“wait-k words”模型,从而解决这些问题。

最后,我们都知道,在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们而言,也是极大地挑战。

基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据,训练得到具有通用翻译能力的模型。

当它接到某一个领域的同传翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,得到相应领域增强模型。最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

结语:AI同传亟待检验据悉,此次百度在AI同传上的重大突破首先在外媒发布。外媒中,给出最好评价的媒体是IEEESpectrum,前文所言,IEEE在报道中认为,百度开发的这个新系统,揭示了一种通过预测未来而保持稳定的翻译工具,可以与联合国会议期间提供同传服务的口译人员相媲美,让人们离软件巴别鱼又近了一步。

此外,还有将百度与谷歌进行对比的,如南华早报评论:随着百度新的翻译系统亮相,百度向谷歌发起了挑战。

除了这两家之外,其他媒体报道内容差不多,多对该技术存在观望的态度,或与谷歌等相对比。

众所周知,之前科大讯飞AI同传造假事件,使得大众对于AI机器翻译能力产生很大的疑问。在此阶段,百度宣布AI同传技术的重大突破,难免会让人产生疑虑。

不过,该技术到底好与不好,究竟是重大突破,亦或是只是完美Demo,到时候我们一看便知。因为,最快百度将于下周的年度技术大会上,对该技术进行公开展示。

标签: 同传 难题