機器翻譯是指利用計算機把一種自然語言翻譯成另一種自然語言的技術(shù),是一門結(jié)合了語言學和計算機科學等學科的交叉學科。認知智能是人工智能的最高階段,自然語言理解是認知智能領(lǐng)域的“皇冠”。機器翻譯這一自然語言處理領(lǐng)域最具挑戰(zhàn)性的研究任務(wù),則是自然語言處理領(lǐng)域“皇冠上的明珠”。近年來,機器翻譯發(fā)展十分迅猛,但對于機器翻譯與人工翻譯孰優(yōu)孰劣、機器翻譯能否取代人工翻譯,一直存在爭議。機器翻譯之父韋弗曾提出“翻譯即解碼”的結(jié)構(gòu)主義觀點,但是,數(shù)年之后,他自己又推翻了這一論斷,表示“機器成不了普希金,機器翻譯永遠都無法傳達出語言本身的優(yōu)雅與格調(diào)”。
機器翻譯發(fā)展迅速
語言能力是區(qū)分人類和動物的重要特征之一,是人類有效交流的保證。用機器來進行語言翻譯的想法,最早可追溯到古希臘時期,F(xiàn)代意義上的“機器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語言的歷史》一書中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機器翻譯的思想。直到2006年Hinton提出深度學習技術(shù),才為實現(xiàn)這一目標提供了更好的解決途徑。目前的前沿技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò)的機器學習,其技術(shù)核心是一個擁有海量節(jié)點(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò),可以自動地從語料庫學習翻譯知識。一種語言的句子被向量化之后,在網(wǎng)絡(luò)中層層傳遞,轉(zhuǎn)化為計算機可以“理解”的表示形式,再經(jīng)過多層復(fù)雜的傳導運算,生成另一種語言的譯文。
2015年,蒙特利爾大學引入注意力機制,使得神經(jīng)機器翻譯達到實用階段。此后,神經(jīng)機器翻譯不斷取得進展。2016年,谷歌GNMT發(fā)布,該系統(tǒng)可模仿人腦的神經(jīng)思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話語義識別達到人類水平,訊飛上線NMT系統(tǒng),神經(jīng)機器翻譯開始被大規(guī)模應(yīng)用?茖W雜志Nature梳理了2016年科技領(lǐng)域的十大突破,排在首位的就是人工智能,其中提及人工智能的機器翻譯使錯誤減少了約60%。隨后,F(xiàn)acebook的人工智能研究團隊開發(fā)了一種新的神經(jīng)機器翻譯算法,在三種機器翻譯任務(wù)上得分高于所有同類系統(tǒng)。2017 年,微軟在斯坦福問答數(shù)據(jù)集 SQuAD 上達到人類水平。機器翻譯的發(fā)展速度遠遠超出人們的想象,但是對于機器翻譯是否能夠真正完全代替人工翻譯,學界仍舊爭論不休。
機器翻譯取代人工翻譯
目前而言,一部分專家認為機器翻譯很快會達到人工翻譯水平,在不遠的將來會完全取代人工翻譯。2010年,谷歌機器翻譯專家歐赫認為文本機器翻譯是合理有效的,真正的挑戰(zhàn)只在語音識別方面。他提出,未來幾年即有可能實現(xiàn)手機端語音到語音的自動翻譯。2019年2月《衛(wèi)報》刊登《機器翻譯的時代是否已經(jīng)到來》一文,美國韋弗利實驗室(Waverly Labs)的安德魯·奧喬亞表示“在未來十到十二年內(nèi),機器翻譯技術(shù)可與人工翻譯相媲美,甚至超過人工翻譯的水平”。
專家們對于機器翻譯的信心來自最新一代的翻譯技術(shù)——神經(jīng)網(wǎng)絡(luò)翻譯。神經(jīng)網(wǎng)絡(luò)翻譯打造的機器翻譯系統(tǒng),采用了一系列新的學習手段來模擬人工翻譯。首先,利用人工智能任務(wù)的天然對稱性進行對偶學習。當訓練集中的一個中文句子被翻譯成英文后,系統(tǒng)會將相應(yīng)的英文結(jié)果再翻譯回中文,并與原始的中文句子進行比對,進而從這個比對結(jié)果中學習有用的反饋信息,對機器翻譯模型進行修正。其次,利用推敲網(wǎng)絡(luò),模擬人們寫作時不斷推敲、修改的過程。這樣,通過多輪翻譯,不斷地檢查、完善翻譯的結(jié)果,使翻譯的質(zhì)量得到大幅提升。再次,采用聯(lián)合訓練的方法迭代改進翻譯系統(tǒng)。用中英翻譯的句子對去補充反向翻譯系統(tǒng)的訓練數(shù)據(jù)集,同樣的過程也可以反向進行。最后,采用一致性規(guī)范讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結(jié)果。這一系列技術(shù)有效模仿了人工翻譯的過程,極大提升了機器翻譯的整體質(zhì)量。
除此之外,機器翻譯相關(guān)學科之間的互動更加頻繁,合作更加緊密。翻譯界和技術(shù)界都呈現(xiàn)出了更大的包容性,相關(guān)人士達成一定共識,即過去那種把語言學家排除在外,僅依賴技術(shù)界,埋頭做數(shù)據(jù)、分析開發(fā)系統(tǒng)的做法是不可取的。在語言學和翻譯學領(lǐng)域,越來越多的人開始關(guān)注機器翻譯,對技術(shù)應(yīng)用探索也不再一味抵觸,開始從用戶和市場需求的角度來客觀看待不同層級和不同受眾的語言服務(wù),計算機輔助翻譯在專業(yè)翻譯領(lǐng)域發(fā)揮著越來越重要的作用。 機器翻譯技術(shù)仍備受質(zhì)疑
對于現(xiàn)有的機器翻譯技術(shù),很多學者也表示質(zhì)疑。一方面,他們認為機器翻譯的廣泛適用性還有待考察。盡管機器翻譯在某些測試中正確率較高,而且在某些領(lǐng)域接近或超過人工譯員,但是這些測試只是針對特定范圍的文本,要想達到測試水平,必須滿足對于源語言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機器翻譯研究》中表示,目前的機器翻譯系統(tǒng)對普通文本的翻譯在可讀性和準確性方面離人們的實際需求還有相當大的距離。機器翻譯系統(tǒng)對普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達到出版的要求,所花費的時間和費用往往會超過純?nèi)斯しg。在口譯方面,中國科學院自動化研究所宗成慶在《機器翻譯的夢想與現(xiàn)實》中指出,在日?谡Z對話中,目前口語機器翻譯僅能對資源較為充分的語言(如英漢、日漢等),在說話場景不是非常復(fù)雜、口音基本標準、語速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿足正常交流的需要。
另一方面,針對機器翻譯的譯文整體水平,目前還沒有建立起專業(yè)合理的評價體系。目前使用較多的是BLEU和METEOR標準,BLEU評測由IBM公司于2002年提出,認為翻譯系統(tǒng)的譯文越接近人工翻譯,翻譯的質(zhì)量就越高。該評測通過分析候選譯文和參考譯文中n元組共同出現(xiàn)的程度來定義系統(tǒng)譯文與參考譯文之間的相似度,缺點在于沒有考慮翻譯的召回率。METEOR標準于2004年由Lavir提出。研究表明,召回率基礎(chǔ)上的標準相比于那些單純基于精度的標準(如BLEU),其結(jié)果和人工判斷的結(jié)果有較高相關(guān)性。微軟全球技術(shù)院院士黃學東表示,“當機器翻譯質(zhì)量很差的時候,使用 BLEU 評分還行,但是當機器翻譯質(zhì)量提高以后,就需要靠人類來評價”。但人工評價很難保持統(tǒng)一的標準,所以有些專家直接否定了現(xiàn)有的評價體系以及將譯文水平量化的做法。美國印第安納大學侯世達教授在《論谷歌翻譯的淺薄》一文中表示,“這是一種對無法量化的事物進行量化的偽科學,用看上去很科學的圖表去證明翻譯質(zhì)量,不過是對科學方法的濫用而已”。
機器翻譯不可能代替人工翻譯
神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的應(yīng)用帶動了機器翻譯的飛速發(fā)展,使得一部分學者對此非常樂觀,但也有許多學者對此提出了批評。語言學和翻譯學界的很多學者認為目前機器翻譯的發(fā)展有限,“信”尚且未達成,更遑論取代人工翻譯。多位學者表示人在翻譯中的主動性和創(chuàng)造性是機器無法比擬的。如美國加州大學伯克利分校語言學系教授喬治·萊考夫與美國俄勒岡大學哲學系教授馬克·約翰森在《我們賴以生存的隱喻》一書中提出,語言在本質(zhì)上更多是隱喻性而非事實性的。人類語言習得;趯Τ橄蟮摹⒕哂斜扔饕饬x的概念的學習,向機器解釋這些概念非常困難,文學翻譯更是機器翻譯難以逾越的鴻溝。胡壯麟在《語言學教程》中提出,僅靠文本分析、忽略現(xiàn)實、沒有“人”這一主體參與的“機器翻譯”,是站不住腳的。
專家們認為測試中機器翻譯技術(shù)的進步帶來的譯文雖有改善,但不論文本翻譯還是口譯,機器翻譯的質(zhì)量遠沒有達到令人滿意的水平。盡管機器翻譯已迭代至神經(jīng)網(wǎng)絡(luò)翻譯,宗成慶研究員在《機器翻譯的夢想與現(xiàn)實》中指出,目前的翻譯系統(tǒng)“難以準確處理篇章范圍內(nèi)的指代問題,無法準確區(qū)分由于細微文字或句法差異造成的句子語義反轉(zhuǎn),無法從譯員譯后編輯過程中自動學習翻譯知識。在復(fù)雜長句翻譯中大量出現(xiàn)漏翻、錯翻和次序顛倒;面對原文的噪聲束手無策;俚語成語的翻譯仍是不可攻克的堡壘,機器同聲傳譯的語音識別問題仍然沒有很好地解決”。清華大學智能技術(shù)與系統(tǒng)實驗室主任劉洋在《基于深度學習的機器翻譯》的報告中提到了機器翻譯的進展和面臨的三個挑戰(zhàn),知識整合、解釋性和對噪聲具有魯棒性,F(xiàn)有的研究正針對這三個挑戰(zhàn)進行系統(tǒng)優(yōu)化,但從理論研究到應(yīng)用還需要繼續(xù)努力。
人機協(xié)同是必然趨勢
筆者認為機器翻譯和人工翻譯各有優(yōu)勢,人機協(xié)同是必然趨勢。隨著語言學、計算機科學、認知心理學等學科的發(fā)展以及以上學科在機器翻譯領(lǐng)域的進一步合作,機器翻譯技術(shù)的迭代必將以更快的速度持續(xù)發(fā)生,從而推動機器翻譯的質(zhì)量不斷提升至接近甚至在一定條件下達到或超過人工翻譯的水平。但是在情感、文化等需要對語言進行深度理解的情況下,機器翻譯并不能完全代替人工翻譯。二者將在理論發(fā)展、技術(shù)進步與市場推動的多重作用下,成為緊密結(jié)合互補的有機整體,實現(xiàn)真正意義上的人機協(xié)同。
人工智能旨在讓計算機復(fù)制人類的行為?、聽、行動、計劃都是典型的人類行為,而其中最復(fù)雜的任務(wù)是溝通,最難的是具備翻譯的能力。這就是人工智能研究人員將解決機器翻譯問題看作實現(xiàn)人工智能關(guān)鍵的原因。人工智能的時代已經(jīng)到來,與語言服務(wù)業(yè)蓬勃發(fā)展態(tài)勢相適應(yīng)的是,傳統(tǒng)意義上的譯者角色已滿足不了新時代語言服務(wù)提出的新要求。技術(shù)必將逐漸改變?nèi)藗兊墓ぷ、生活方式,實現(xiàn)消滅語言障礙的終極目標。在這個過程中,機器翻譯可以減少譯員大量重復(fù)、翻譯難度較低的勞動,避免翻譯疲勞、提高翻譯效率,替代諸如天氣預(yù)報查詢、旅館預(yù)訂服務(wù)、交通信息咨詢等低端翻譯人員,但不可能取代高端翻譯(如重要文獻、文學名著等翻譯)人員,更不會消除翻譯職業(yè)。如劉星光在《中國機器翻譯研究述評:問題與對策》一書中提出,機器翻譯與人工翻譯并不矛盾,機器翻譯和人工翻譯我們都需要,這要根據(jù)所翻譯的材料而定。
“機器會翻譯了,人類就不需要學習外語”的思維邏輯與“有了計算器,就可以不用學算術(shù)”一樣無稽。即使未來人工智能翻譯在準確性和速度上超越了人工翻譯,人工翻譯在傳達情感、文化以及語言深層含義方面的作用仍不可替代。低端譯員的淘汰,本質(zhì)上講,是行業(yè)內(nèi)部優(yōu)勝劣汰加速的結(jié)果,機器翻譯的出現(xiàn)只是加快了這一進程。人機協(xié)同是人工翻譯在人工智能時代下的必然選擇,也是提升行業(yè)質(zhì)量與競爭力的必由之路。正如趙聯(lián)斌在《論機器翻譯時代人工譯員與機器譯員的共軛相生》一文中提到,“未來的人工譯者絕不是僅懂計算機技術(shù)或僅具備雙語能力的人,而應(yīng)是集計算機能力與雙語能力于一體的復(fù)合型人才”。
(作者單位:廈門大學嘉庚學院)