6080YYY午夜理论三级,国产疯狂伦交大片,国内精品美女A在线播放,国产日韩精品久久久一区二区

提供高品質(zhì)的翻譯服務(wù)是卓越翻譯的生存之道

語言研究漫談巴別塔和機(jī)器翻譯引擎

卓越翻譯 2023年03月15日


最近幾年,人類的世界的確熱鬧非凡。除了可控核聚變實(shí)驗(yàn)取得歷史性突破外,去年年底發(fā)布的ChatGPT就頗讓上帝驚呼了一番人類的瘋狂,前幾日常溫超導(dǎo)的新聞橫空出世也讓人們浮想聯(lián)翩。未來,一切常規(guī)工種也許都被AI和AI指揮的各種機(jī)器人承包了;人類也許解決了能源問題,出行不再依賴地面交通網(wǎng)絡(luò)。那時(shí)候,世界必定更加精彩,也許更加無趣。

《圣經(jīng)舊約創(chuàng)世記》第11章里面講了一個(gè)關(guān)于巴別塔的故事。在很久很久以前,人類都講著同一種語言。瘋狂的人類產(chǎn)生了修建一座通天之塔,順著通天之塔爬到天堂的想法。由于大家的語言統(tǒng)一,協(xié)調(diào)起來很快,通天之塔很快就進(jìn)入修建狀態(tài)。這座修建中的通天之塔被命名為Babel Tower,中文世界一般將之翻譯為巴別塔。萬能的上帝很不滿于人類的狂妄自大和對(duì)神靈的褻瀆,決定懲罰一下愚蠢的人類。上帝施展魔法,讓全世界有了各種各樣的語言。從此,人類世界的溝通不再暢順,誤解和嫌隙很快出現(xiàn),巴別塔的修建因?yàn)檫@種誤解半途而廢。正是因?yàn)橛辛瞬煌恼Z言和文化背景,人類世界從此沖突不斷,戰(zhàn)亂頻仍。從這個(gè)故事來看,萬能的上帝不但會(huì)魔法,而且不經(jīng)意間創(chuàng)造了人類世界的種族沖突和戰(zhàn)亂。但,就像古希臘神話中統(tǒng)治世間萬物至高無上的天神宙斯一樣,被供奉于殿堂之上。對(duì)于無神論者來說,這個(gè)故事顯然只是一個(gè)故事。對(duì)于信奉上帝的人們來說,上帝永遠(yuǎn)是那么的仁慈。

獲得奧斯卡提名的影片《Babel》在結(jié)束語中講到,“the brightest light in the darkest night”,即便是在溝通困難重重的環(huán)境下,人類還是克服一切阻力來達(dá)到信息傳遞和交流。據(jù)說,巴別塔的故事,便是翻譯這門職業(yè)的起源。在中國,最早的翻譯起源于《越人歌》的翻譯,相傳是中國第一首譯詩。鄂君子皙泛舟河中,打槳的越女愛慕他,用越語唱了一首歌,歌詞中唱到“山有木兮木有枝,心悅君兮君不知”鄂君請人用楚語譯出,就是這一首美麗的情詩。有人說鄂君在聽懂了這首歌,明白了越女的心之后,就微笑著把她帶回去了。不管是西方的故事還是東方的故事,翻譯所起到的作用都是信息的傳遞和溝通。信息的傳遞和溝通是消除一切誤會(huì)和嫌隙的必要手段。巴別塔的修建雖然半途而廢,但是人類世界修建新的巴別塔的努力從來沒有停止過。這“新的巴別塔”便是機(jī)器翻譯引擎,它被譽(yù)為AI領(lǐng)域的明珠,人工智能的終極目標(biāo)。

說起來,機(jī)器翻譯引擎的發(fā)展也有了近百年的歷史了。

1933年,蘇聯(lián)科學(xué)家Peter Troyanskii、法國科學(xué)家G.B. Artsouni提出了“自動(dòng)翻譯機(jī)”的想法。1954年1月7日,美國喬治敦大學(xué)在IBM協(xié)助下,首次完成了機(jī)器翻譯試驗(yàn),使用IBM 701計(jì)算機(jī)完成了史上首例機(jī)器翻譯,自動(dòng)將60個(gè)俄語句子翻譯成了英語,正式拉開了機(jī)器翻譯研究的序幕。1966年11月,美國科學(xué)院語言自動(dòng)處理咨詢委員會(huì)公布了一份名為《語言與機(jī)器》(簡稱 ALPAC 報(bào)告)的報(bào)告,全面否定了機(jī)器翻譯的可行性,導(dǎo)致機(jī)器翻譯的發(fā)展陷入了十幾年的停滯。1976 年由加拿大蒙特利爾大學(xué)與加拿大聯(lián)邦政府翻譯局聯(lián)合開發(fā)了TAUM-METEO 系統(tǒng);1980年IBM開發(fā)了“翻譯助手”工具。這些古老的翻譯系統(tǒng)都是通過對(duì)句子的語法結(jié)構(gòu)進(jìn)行分析,構(gòu)建語法樹,通過詞語及其形變等進(jìn)行對(duì)應(yīng)的翻譯和修改,簡稱為RBMT。RBMT視圖使用規(guī)則的方法來解釋不規(guī)則的語言,這注定了它的結(jié)局。

1990年代,人類開發(fā)的機(jī)器翻譯系統(tǒng)進(jìn)入了基于機(jī)器統(tǒng)計(jì)引擎Statistical Machine Translation的時(shí)代,其特點(diǎn)是通過統(tǒng)計(jì)分析大量的翻譯語料庫Translation Corpus建立翻譯模型來完成翻譯任務(wù)。它背后的邏輯很簡單,就是“如果人們都這么翻譯,我也這么翻”。翻譯引擎的質(zhì)量終于達(dá)到了實(shí)用的階段,但是仍然不夠準(zhǔn)確。

2014年,蒙特利爾大學(xué)學(xué)者Kyunghyun Cho等人發(fā)表論文《Learn Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation》,被稱為是在機(jī)器翻譯中應(yīng)用神經(jīng)網(wǎng)絡(luò)的定鼎制作,這催生了兩年之后谷歌翻譯引擎的誕生。神經(jīng)網(wǎng)絡(luò)技術(shù)本身提出時(shí)間很早,但是人類重新注意到它也只是20年前的事情。今天,人們熟悉的谷歌翻譯、DeepL,都采用了這一技術(shù)。簡單來說,神經(jīng)網(wǎng)絡(luò)技術(shù)通過尋找語言文本里面的特征,對(duì)語言進(jìn)行“理解”之后,用另外一種語言進(jìn)行重新描述,從而達(dá)成翻譯的任務(wù)。DeepL采用改進(jìn)的神經(jīng)網(wǎng)絡(luò)技術(shù),其翻譯結(jié)果準(zhǔn)確性較谷歌翻譯引擎更為優(yōu)異。

2022年底,美國OpenAI發(fā)布了基于大型語言模型Large Language Model理論的聊天機(jī)器人ChatGPT,把機(jī)器翻譯的算法再次向前推進(jìn)了一大步。ChatGPT通過處理大量數(shù)據(jù)來響應(yīng)提示,這注定了其算法的優(yōu)異之處在于,只要給它足夠的數(shù)據(jù),其翻譯的結(jié)果必定會(huì)越來越準(zhǔn)確。和別的翻譯引擎不同的是,可以告訴ChatGPT需要翻譯的句子的一些環(huán)境信息,這被稱為提示詞(Prompt)翻譯。比如,你可以告訴它“這是醫(yī)療領(lǐng)域的一個(gè)句子,請將它從法語翻譯成德語”。目前業(yè)界普遍認(rèn)為,通過不同領(lǐng)域、不同語種的大量數(shù)據(jù)訓(xùn)練之后,ChatGPT前景光明。ChatGPT將來既可以適用于口語化的翻譯,也足以適用于專業(yè)化的翻譯。但是,就目前的實(shí)際測試結(jié)果來看,ChatGPT相較人工專業(yè)翻譯,不論是準(zhǔn)確性還是魯棒性,仍然存在不小的差距。專業(yè)的翻譯會(huì)對(duì)ChatGPT翻譯的結(jié)果提出很多優(yōu)化建議。不管怎么說,現(xiàn)在的谷歌翻譯、DeepL和ChatGPT,已經(jīng)能夠解決很多問題。那么,機(jī)器翻譯引擎何時(shí)能夠達(dá)到并超過人工專業(yè)翻譯的水平?時(shí)間,會(huì)告訴我們一切問題的答案,不是么?可以想象,隨著人工智能引擎的發(fā)展,人類修建的新的巴別塔將越來越高,萬能的上帝給人類設(shè)置的懲罰將遲早有一天不復(fù)存在。

文章最后,順便探討一個(gè)話題,人類是不是就可以不再學(xué)習(xí)新的語言了呢?人們在整個(gè)小學(xué)階段、初中階段,花費(fèi)最大的精力進(jìn)行學(xué)習(xí)的,其實(shí)是自己的母語。人們連自己的母語尚且需要花費(fèi)大量的精力進(jìn)行學(xué)習(xí),何況新的語言乎?學(xué)習(xí)語言不僅僅只是為了推翻上帝的懲罰,不僅僅只是簡單的溝通,更重要的,其實(shí)是在學(xué)習(xí)語言的過程中,體驗(yàn)各種文化的魅力。Ludwig Wittgenstein的一句名言:“我的語言之局限,即我的世界之局限”,可以作為這個(gè)問題的the Best Answer。

 

本文為本站(www.hk-tmoxgear.cn)原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系。