2016云棲大會(huì)番外篇 蹩腳的機(jī)器翻譯是這樣
今天的北京 ,被霧霾籠罩,燦爛的陽光顯得那么黯淡無光。每年北京一旦跨入深秋,每天只能與霧霾做伴,呼吸那具有特色的“空氣”。在千里之外的杭州,那里正在上演一場場科技狂歡。由阿里巴巴主辦的2016杭州云棲大會(huì)正如火如荼的進(jìn)行,相比于這霧霾,技術(shù)顯然正在受到無數(shù)人的熱捧。
2016年10月14日 霧霾中的北四環(huán)
今年的云棲大會(huì)異常火爆,入場券可謂一票難求。據(jù)說有超過3萬人參加報(bào)名,最遠(yuǎn)的報(bào)名者來自瑞典。而今年的大會(huì)時(shí)間也翻了一倍,由2天增加到4天時(shí)間,另外還有近2萬平米的科技展廳,物聯(lián)網(wǎng)、人工智能、智能物流、智慧金融等等最新科技都會(huì)一一展現(xiàn)。而包括馬云、王堅(jiān)等一大批大咖也會(huì)蒞臨,發(fā)表主題演講。
在議程上,阿里集團(tuán)旗下各個(gè)分支的主要技術(shù)官都會(huì)一一登場,包括阿里巴巴集團(tuán)技術(shù)委員會(huì)主席王堅(jiān)、阿里云首席科學(xué)家周靖人、螞蟻金服首席技術(shù)官程立 、阿里巴巴集團(tuán)首席技術(shù)官張建鋒、高德技術(shù)副總裁田密等。雖然大咖眾多,但是現(xiàn)場座位有限,所以在各大視頻平臺(tái)就主論壇會(huì)進(jìn)行同步直播。
直播好呀,每個(gè)人既不用掏門票,也不是花費(fèi)時(shí)間和精力去跑場。線上觀看,簡單方便,輕松自然。但是既然是同步直播,如何精準(zhǔn)及時(shí)的為用戶呈現(xiàn)文字是一個(gè)很大的挑戰(zhàn)。本次兩天的主論壇直播,采用機(jī)器翻譯(或者叫人工智能翻譯)。筆者守在電腦屏幕前,看了一上午。雖然精彩的分享吸引我,但是機(jī)器翻譯的文字倒是逗得我哈哈大笑,先來一張。
在上面,我們可以看到本來“Fuxi Master”被機(jī)器翻譯為“伏羲馬術(shù)”。如果不整個(gè)觀看這場演講和理解上下文,那么肯定會(huì)被搞暈?,F(xiàn)在,很多語言都會(huì)采用機(jī)器翻譯,畢竟人工翻譯太費(fèi)時(shí)費(fèi)力,雖然準(zhǔn)確,但是速度慢。以谷歌、百度為代表的搜索引擎,大力發(fā)展機(jī)器翻譯。最新的新聞是2016年9月27日,谷歌宣布發(fā)布神經(jīng)機(jī)器翻譯。據(jù)稱,該機(jī)器翻譯的準(zhǔn)確度,可以匹敵真人,以致有網(wǎng)友大聲疾呼“以后終于可以不用在學(xué)英語了”。雖然筆者沒有試過,但是這種翻譯主要適用于靜態(tài)文本翻譯,而不是動(dòng)態(tài)真人語言翻譯。把它拿到這兩天的云棲大會(huì)上,不知道能否避免上述的情況。在筆者聆聽阿里巴巴集團(tuán)首席技術(shù)官張建鋒的演講中,更多的機(jī)器翻譯錯(cuò)誤隨之涌上來。
上面是張建峰舉的一個(gè)高爾夫球桿的例子,筆者不明白“生產(chǎn)這個(gè)高爾夫球桿”被機(jī)器翻譯成了“生產(chǎn)這個(gè)寡婦干”。這是什么意思,至今沒弄明白。
把傳感器安置在球桿里,人們可以準(zhǔn)確地知道揮桿的動(dòng)作、頻率等,結(jié)果機(jī)器把“揮桿”翻譯成了“徽章”。難道是機(jī)器想要獲勝,領(lǐng)取徽章嗎?
深度學(xué)習(xí)是很流行,但是機(jī)器估計(jì)太贊賞自己了,翻譯成“非常流流流行”,讓人來強(qiáng)調(diào)的話,也應(yīng)該是“非常流行非常流行非常流行”。
這機(jī)器又扯到“海南個(gè)體化”,越來越不懂。人們一直在爭論機(jī)器翻譯和人工翻譯的差別。嚴(yán)復(fù)曾經(jīng)表示,翻譯的目標(biāo)是“信、達(dá)、雅”。翻譯有兩個(gè)層次,一是直譯,即按照字面的意思來翻譯,其二是意譯,讓翻譯更加順口,符合真實(shí)的意思。不過,即使現(xiàn)在的機(jī)器翻譯,憑借人工智能,依然遠(yuǎn)遠(yuǎn)達(dá)不到人類的要求。目前,最普通的機(jī)器翻譯是一個(gè)一個(gè)詞翻譯出來,更先進(jìn)的是看前后單詞意思的最佳搭配。但是,就文章而言,機(jī)器翻譯目前并不加入文化因素和社會(huì)習(xí)俗等,因此可以說機(jī)器翻譯是“只見樹木、不見森林”。而讓機(jī)器翻譯口語,那簡直是難上加難,以中國來說,全國56個(gè)名族,還有各地不同的發(fā)音,有語氣、聲調(diào)等很多特殊因素。即使是在一個(gè)省,可能人們之間還是聽不懂對方的話。因此,口語的機(jī)器翻譯難度更加困難。
不過,在云計(jì)算和大數(shù)據(jù)時(shí)代,人工智能的翻譯還是很有前途的。畢竟,深度學(xué)習(xí)讓機(jī)器更加聰明。通過海量的數(shù)據(jù)輸入,機(jī)器可以學(xué)習(xí)人類如何翻譯文字和口語。不過,未來機(jī)器翻譯會(huì)越來越厲害,但是人類翻譯并不會(huì)消失。谷歌依靠搜索引擎和人工智能以及深度學(xué)習(xí)大力發(fā)展機(jī)器學(xué)習(xí),但是韓國有一款翻譯軟件卻夢想著依靠眾包的方式來解決翻譯問題。人們在翻易通上,既可以成為翻譯家,也可以是求助者。如果你能成功為別人翻譯英語,就會(huì)獲得相應(yīng)的金幣。而一個(gè)人第一次求助發(fā)布文字時(shí),會(huì)有2次的免費(fèi)機(jī)會(huì),而以后則需要花費(fèi)相應(yīng)的金幣。
“做魚丸”看來機(jī)器也想吃東西了。機(jī)器翻譯速度是很快,但是準(zhǔn)確性還需要大大改善。如果真用人類來進(jìn)行同步翻譯,不一定適用。筆者以為,未來機(jī)器翻譯和人工翻譯將會(huì)分化出不同的應(yīng)用場景,機(jī)器翻譯適用于快速、短時(shí)的翻譯,而人類翻譯則注重文化度高的翻譯,比如圖書出版等。
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由財(cái)神資訊-領(lǐng)先的體育資訊互動(dòng)媒體轉(zhuǎn)載發(fā)布,如需刪除請聯(lián)系。