AI同传在博鳌论坛表现欠佳,技术进步还需更多耐心

白水语音识别2018/04/13

4月8日至11日,全国乃至全球媒体的注意力都集中在博鳌亚洲论坛,这里汇集了多国首脑政要与高层人士,他们进行的讨 […]

4月8日至11日,全国乃至全球媒体的注意力都集中在博鳌亚洲论坛,这里汇集了多国首脑政要与高层人士,他们进行的讨论与决策,不仅会影响亚洲经济发展,更会影响全球经济走向,其规格之高、意义之重无需多言。

今年博鳌论坛的一个变化就是引入了人工智能进行AI同声传译,其实AI同传不是新鲜事物,早在2016年的乌镇大会上,搜狗就率先推出搜狗同传,为大会提供机器同传服务。但因为博鳌论坛的影响力且是举办17年以来的首次尝试,从而引起广泛关注。但担负此项重任的腾讯AI同传现场却表现不佳, AI同传也一时成了大家的吐槽对象。

抛开腾讯AI同传在博鳌论坛的表现,机器翻译的难点在哪里,国内机器翻译研究水平到底如何,值得行业关注与思考。

腾讯AI同传现场翻车

在一场主题为“全球化下半场:风险和不确定性”的分论坛中,腾讯AI同传产生了许多错误,下图是公众号“遇见人工智能”截取的直播小程序页面,和会议现场的显示是一模一样的,可以看到,翻译出来的内容支离破碎,已经无法正常理解和阅读。

图片 1

此外,腾讯AI同传还出现了类似下图这样,不断重复无意义单词和字符混乱的情况。

图片 1

博鳌亚洲论坛作为亚洲乃至全球的一场有影响力的峰会,本是机器同传一展身手,捕获各方政要“芳心”的绝佳时刻。而此次论坛中的AI同传却错误频频,在吐槽腾讯AI同传的同时,一个更加值得关注的问题是国内机器同传发展水平到底如何?机器同传的难点到底在哪里,我们又该如何去进一步突破。

AI同传的挑战

从行业整体发展来看,认知智能相较于感知智能来说,在引入深度学习方面慢了一拍,整体发展还不成熟,其核心自然语言理解更是业界公认的难点。作为认知智能的落地应用之一,AI同传也会受制于认知智能的整体发展。

比如在博鳌论坛上,腾讯AI同传将“一带一路”翻译成了“一条公路和一条腰带”,这背后的故事是,演讲嘉宾将“一带一路”的固定说法“the belt and road”说成了“the road and belt”,这种需要“反应一下”的工作,人类可以轻松完成,但对于缺乏上下文背景、没有背景知识的机器来说,则是非常艰巨的任务。

此外,在翻译领域,即使是两位专业翻译人员对于完全相同的句子也会有略微不同的理解,而机器翻译面临的挑战就更大,比纯粹的模式识别要复杂的多。

腾讯机器翻译应用AI同传选择在博鳌亮相,又同时面临复杂的应用场景:

第一,各国语言与口音混杂。博鳌论坛嘉宾来自世界各地,即便都使用英语,也存在不易识别的口音问题。英语就分美式发音、英式发音、中式发音等。通常的英文识别引擎侧重的更多是美式发音和中式发音,但是如果遇到其它发音方式,识别的效果也会大大折扣。因此,多样化的发音方式、口音都给AI同传的第一步语音识别带来巨大的挑战。

第二,是会议内容专业性强。无论是腾讯的AI同传还是其他企业的机器同传,所做研究的主要应用方向都是通用领域的,对于极其专业和严肃的博鳌论坛来说,如何对专业词汇、术语、关键的观点进行精准的翻译也是一个难题。即使是人工同传,也需要花费大量的时间来学习和掌握经济、政治等这里领域的概念术语的翻译。

针对腾讯AI同传在博鳌论坛中的表现,搜狗同传负责人表示,博鳌论坛中出现的问题,其实是目前行业内都在面临的几个挑战,总体来讲就是不同口音的语音识别难、会议内容的领域性强、语音识别错误对机器翻译的干扰、口语化文本翻译难等难题。

中国机器翻译,水平到底如何?

从2014年开始,机器翻译技术上开始从统计机器翻译(SMT)向神经机器翻译(NMT)的迁移。深度学习技术的应用和底层框架的突破,使目前国内机器翻译取得阶段性进展。

拿搜狗来说,作为国内较早从事机器同传的团队,搜狗早在2016年就在乌镇互联网大会上推出了机器同传产品。这也是全球首个基于深度神经机器翻译技术的商用翻译产品。目前搜狗的同传翻译已经基于业界领先的Transformer框架。搜狗同传目前已经在国内很多顶级大会上得到了应用,已经成功为数百场顶尖行业盛会提供过机器同传服务。

除此之外,搜狗手机输入法上线了文本翻译和语音翻译的能力,日均请求达800万次。搜狗还推出了搜狗翻译APP、搜狗旅行翻译宝、搜狗翻译笔等各个形式的AI翻译产品。在国际翻译比赛方面,搜狗荣获了国际顶级机器翻译比赛WMT 2017中英和英中赛道的冠军,再一次在顶尖的国际舞台证明了搜狗的翻译技术实力。

图片 1

搜狗同传负责人表示,搜狗同传取得的这些技术进步,主要得益于搜狗同传的技术团队在自然语言处理和深度学习方面有深厚的积累,同时也是搜狗同传走在行业前沿的关键原因。

与此同时,我们也应该看到机器翻译作为AI研究的前沿方向之一,仍处行业于最早期,比如业界机器翻译的准确率普遍略低,机器翻译最难的部分在于盲传,它没有背景知识,而翻译本身又严重依赖上下文。这有赖于自然语言技术的突破。

所以腾讯AI同传面临的挑战和问题,是行业内共有的。人工智能的发展仍然处在初级阶段,机器同传应该给予更多的包容和时间,让这些产品在博鳌论坛这样规模的会议进行检验。

zhidx

友情链接:30737   22168   41007   6360   36571   9386   89385   91486   20412   53457   36874   45174   85589   17973   50732   90439   55998   16502   37932   36585