找回密码
 注册
搜索
查看: 2677|回复: 4

[EN] 谷歌新翻译系统很牛?实则只进步“一丢丢”

[复制链接]
发表于 2016-10-2 21:07 | 显示全部楼层 |阅读模式
        近日,Google发布新版神经机器翻译(GNMT)系统,并表示使用了最先进的训练技术,翻译质量会有较大提升。
        虽然Google一直都在将神经网络技术用于自己的人工智能产品,但好像自Alphago以后,“神经”二字特别敏感,新的翻译系统也引起了不少争论。现在流传比较广的评价来自从事翻译职业的网友:
        作为翻译,看到这个新闻的时候,我理解了18世纪纺织工人看到蒸汽机时的忧虑与恐惧。
        这种兼具历史感与行业认知的评价特别感染人。不过凡事要客观看待,亲测后发现,翻译质量比传统的机翻体验好上不少,但仍不到实用的地步。
        如果你想知道“如何评价”这件事,或许可以看看加拿大国家研究委员会NRC多语言处理研究组陈博兴研究员的点评。他目前是加拿大国家研究委员会信息与通信技术研究所研究员。研究方向是自然语言处理,主要研究领域是机器翻译,多语言信息处理等。
       
        本文原载于作者微博,观察者网获授权转载,以下是点评内容:
        这两天,“受邀”在几个微信群里点评刷遍微博和微信朋友圈的关于Google神经网络机器翻译的文章和报道。我的点评如下:
        首先,Google所做的事情是将这两年学术界神经网络机器翻译的多种最新技术做了一个整合集成,利用他们强大的工程能力和计算能力,搭了一个很好的系统。他们最好的单系统比我利用Open source训练的系统,在同一个数据集上要好了大概3个多BLEU。3个多BLEU的差距,如果由人来判断,仔细看的话,是能感觉到的,但是也就是一个小的进步,谈不上突破什么的。
        对于他们的文章,我觉得有两个遗憾的地方:
        1. 所采用的技术都是之前发表过的,没有全新的技术(对Google的要求自然要高一点)
        2. 如果我们有那么大的计算和工程能力,以及那么多人力可以投入,即使只是整合已有技术,我觉得我们可以做得更好,比如我会加上清华大学刘洋他们首先采用的最小风险训练方法来进行训练,等等。
        其次,媒体往往是无知的,为了博人眼球而什么话都敢说的。甚至有媒体想当然地说Google是把AlphaGo神经网络应用到Google翻译。拜托,这是完全不同的神经网络。什么都不懂就敢胡乱开牙是媒体、尤其是国内媒体的通病。
        那么Google翻译达到了人类翻译的水准吗?那要看在什么语言,什么领域,什么任务上。举个极端的例子,如果只是翻译单个单词,我们99.99%的人都比不过电子词典。如果只是翻译比较短的句子,训练语料里覆盖得全而且次数多的句子,机器翻译自然有优势。但要是一个全面的比较,机器翻译跟专业译员的距离相差还是很大的。其实所有的人工智能都是同样的,什么人脸识别超过人类,语义理解超过人类等等,下次再碰到这么说的公司或者媒体,别理他!活不好好干,就知道忽悠人。
        最后的问题,来源于一个这次刷屏的标题,“作为一个翻译,我理解18世纪纺织工人看到蒸汽机的忧虑和恐惧”。且不说这个类比不恰当,就算恰当,没看见19、20世纪的纺织工人数量比18世纪高了不止一个数量级吗。作为一个18世纪的纺织工人你担心什么啊。
        翻译也是这样,机器翻译在可以预见的未来取代不了人工翻译。尤其是现在的人工翻译的市场跟机器翻译的市场基本上不重合,人工翻译对准的是高端市场,要求很精准的翻译需求,而机器翻译则是:
        1. 要求不那么精准的翻译情景,比如旅游,比如网页浏览,比如信息监控等等。
        2. 机器翻译帮助专业翻译人员提高效率。
        如果中国对外交流的程度达到欧美现在的程度,那么中国的高端翻译市场将会是无比巨大的。有志于从事翻译的同学,放心大胆地进来吧。当然了,作为一个翻译,如果你到现在还装作看不见机器翻译的进步,还在完全排斥机器翻译,那么被市场淘汰就怨不得别人了。

 楼主| 发表于 2016-10-2 21:09 | 显示全部楼层
热评

abcd15469_1s31b:“我妈妈很疼我“,谷歌新的神经智能翻译成了“my mother hurts me”,这离吹嘘的智能实在差的有点远。

Maureen:骗而已

荒川围脖:机器翻译的根本问题在于机器并不理解语句。那么什么是理解呢?抱歉,人工智能专家只能说要等强人工智能出现后才知道,但是抢人工智能什么时候能出现,专家们也不知道。

独翅鸟:没有自己的东西,靠堆料吹牛,等着国内哗众取宠的段子手和广告商,以及精神阳痿患者捧上天,这是谷歌近期的套路

Kris:为了符合中国读者,特别是本网读者的认知阅读习惯,连人译都要改了又改,何况用谷歌。
发表于 2016-10-2 21:12 | 显示全部楼层
丢丢啥意思
 楼主| 发表于 2016-10-2 21:18 | 显示全部楼层
一点点吧,好像是上海话
发表于 2016-10-3 13:34 | 显示全部楼层
一丢丢是白话,目测应该是北方用的多。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|虎纹猫家园

GMT+8, 2024-11-1 07:52 , Processed in 0.036786 second(s), 14 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表