丹東機器翻譯與人工翻譯之爭
信息來(lái)源:發(fā)布時(shí)間:2019/7/26 15:20:48
機器翻譯是指利用計算機把一種自然語(yǔ)言翻譯成另一種自然語(yǔ)言的技術(shù),是一門(mén)結合了語(yǔ)言學(xué)和計算機科學(xué)等學(xué)科的交叉學(xué)科。認知智能是人工智能的最高階段,自然語(yǔ)言理解是認知智能領(lǐng)域的“皇冠”。機器翻譯這一自然語(yǔ)言處理領(lǐng)域最具挑戰性的研究任務(wù),則是自然語(yǔ)言處理領(lǐng)域“皇冠上的明珠”。近年來(lái),機器翻譯發(fā)展十分迅猛,但對于機器翻譯與人工翻譯孰優(yōu)孰劣、機器翻譯能否取代人工翻譯,一直存在爭議。機器翻譯之父韋弗曾提出“翻譯即解碼”的結構主義觀(guān)點(diǎn),但是,數年之后,他自己又推翻了這一論斷,表示“機器成不了普希金,機器翻譯永遠都無(wú)法傳達出語(yǔ)言本身的優(yōu)雅與格調”。
機器翻譯發(fā)展迅速沈陽(yáng)翻譯公司
語(yǔ)言能力是區分人類(lèi)和動(dòng)物的重要特征之一,是人類(lèi)有效交流的保證。用機器來(lái)進(jìn)行語(yǔ)言翻譯的想法,最早可追溯到古希臘時(shí)期?,F代意義上的“機器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語(yǔ)言的歷史》一書(shū)中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機器翻譯的思想。直到2006年Hinton提出深度學(xué)習技術(shù),才為實(shí)現這一目標提供了更好的解決途徑。目前的前沿技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò )的機器學(xué)習,其技術(shù)核心是一個(gè)擁有海量節點(diǎn)(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò ),可以自動(dòng)地從語(yǔ)料庫學(xué)習翻譯知識。一種語(yǔ)言的句子被向量化之后,在網(wǎng)絡(luò )中層層傳遞,轉化為計算機可以“理解”的表示形式,再經(jīng)過(guò)多層復雜的傳導運算,生成另一種語(yǔ)言的譯文。
2015年,蒙特利爾大學(xué)引入注意力機制,使得神經(jīng)機器翻譯達到實(shí)用階段。此后,神經(jīng)機器翻譯不斷取得進(jìn)展。2016年,谷歌GNMT發(fā)布,該系統可模仿人腦的神經(jīng)思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話(huà)語(yǔ)義識別達到人類(lèi)水平,訊飛上線(xiàn)NMT系統,神經(jīng)機器翻譯開(kāi)始被大規模應用??茖W(xué)雜志Nature梳理了2016年科技領(lǐng)域的十大突破,排在首位的就是人工智能,其中提及人工智能的機器翻譯使錯誤減少了約60%。隨后,Facebook的人工智能研究團隊開(kāi)發(fā)了一種新的神經(jīng)機器翻譯算法,在三種機器翻譯任務(wù)上得分高于所有同類(lèi)系統。2017 年,微軟在斯坦福問(wèn)答數據集 SQuAD 上達到人類(lèi)水平。機器翻譯的發(fā)展速度遠遠超出人們的想象,但是對于機器翻譯是否能夠真正完全代替人工翻譯,學(xué)界仍舊爭論不休。
機器翻譯取代人工翻譯沈陽(yáng)翻譯公司
目前而言,一部分專(zhuān)家認為機器翻譯很快會(huì )達到人工翻譯水平,在不遠的將來(lái)會(huì )完全取代人工翻譯。2010年,谷歌機器翻譯專(zhuān)家歐赫認為文本機器翻譯是合理有效的,真正的挑戰只在語(yǔ)音識別方面。他提出,未來(lái)幾年即有可能實(shí)現手機端語(yǔ)音到語(yǔ)音的自動(dòng)翻譯。2019年2月《衛報》刊登《機器翻譯的時(shí)代是否已經(jīng)到來(lái)》一文,美國韋弗利實(shí)驗室(Waverly Labs)的安德魯·奧喬亞表示“在未來(lái)十到十二年內,機器翻譯技術(shù)可與人工翻譯相媲美,甚至超過(guò)人工翻譯的水平”。
專(zhuān)家們對于機器翻譯的信心來(lái)自最新一代的翻譯技術(shù)——神經(jīng)網(wǎng)絡(luò )翻譯。神經(jīng)網(wǎng)絡(luò )翻譯打造的機器翻譯系統,采用了一系列新的學(xué)習手段來(lái)模擬人工翻譯。首先,利用人工智能任務(wù)的天然對稱(chēng)性進(jìn)行對偶學(xué)習。當訓練集中的一個(gè)中文句子被翻譯成英文后,系統會(huì )將相應的英文結果再翻譯回中文,并與原始的中文句子進(jìn)行比對,進(jìn)而從這個(gè)比對結果中學(xué)習有用的反饋信息,對機器翻譯模型進(jìn)行修正。其次,利用推敲網(wǎng)絡(luò ),模擬人們寫(xiě)作時(shí)不斷推敲、修改的過(guò)程。這樣,通過(guò)多輪翻譯,不斷地檢查、完善翻譯的結果,使翻譯的質(zhì)量得到大幅提升。再次,采用聯(lián)合訓練的方法迭代改進(jìn)翻譯系統。用中英翻譯的句子對去補充反向翻譯系統的訓練數據集,同樣的過(guò)程也可以反向進(jìn)行。最后,采用一致性規范讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過(guò)程生成一致的翻譯結果。這一系列技術(shù)有效模仿了人工翻譯的過(guò)程,極大提升了機器翻譯的整體質(zhì)量。
除此之外,機器翻譯相關(guān)學(xué)科之間的互動(dòng)更加頻繁,合作更加緊密。翻譯界和技術(shù)界都呈現出了更大的包容性,相關(guān)人士達成一定共識,即過(guò)去那種把語(yǔ)言學(xué)家排除在外,僅依賴(lài)技術(shù)界,埋頭做數據、分析開(kāi)發(fā)系統的做法是不可取的。在語(yǔ)言學(xué)和翻譯學(xué)領(lǐng)域,越來(lái)越多的人開(kāi)始關(guān)注機器翻譯,對技術(shù)應用探索也不再一味抵觸,開(kāi)始從用戶(hù)和市場(chǎng)需求的角度來(lái)客觀(guān)看待不同層級和不同受眾的語(yǔ)言服務(wù),計算機輔助翻譯在專(zhuān)業(yè)翻譯領(lǐng)域發(fā)揮著(zhù)越來(lái)越重要的作用。
機器翻譯技術(shù)仍備受質(zhì)疑沈陽(yáng)翻譯公司
對于現有的機器翻譯技術(shù),很多學(xué)者也表示質(zhì)疑。一方面,他們認為機器翻譯的廣泛適用性還有待考察。盡管機器翻譯在某些測試中正確率較高,而且在某些領(lǐng)域接近或超過(guò)人工譯員,但是這些測試只是針對特定范圍的文本,要想達到測試水平,必須滿(mǎn)足對于源語(yǔ)言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機器翻譯研究》中表示,目前的機器翻譯系統對普通文本的翻譯在可讀性和準確性方面離人們的實(shí)際需求還有相當大的距離。機器翻譯系統對普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達到出版的要求,所花費的時(shí)間和費用往往會(huì )超過(guò)純人工翻譯。在口譯方面,中國科學(xué)院自動(dòng)化研究所宗成慶在《機器翻譯的夢(mèng)想與現實(shí)》中指出,在日??谡Z(yǔ)對話(huà)中,目前口語(yǔ)機器翻譯僅能對資源較為充分的語(yǔ)言(如英漢、日漢等),在說(shuō)話(huà)場(chǎng)景不是非常復雜、口音基本標準、語(yǔ)速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿(mǎn)足正常交流的需要。
機器翻譯發(fā)展迅速沈陽(yáng)翻譯公司
語(yǔ)言能力是區分人類(lèi)和動(dòng)物的重要特征之一,是人類(lèi)有效交流的保證。用機器來(lái)進(jìn)行語(yǔ)言翻譯的想法,最早可追溯到古希臘時(shí)期?,F代意義上的“機器翻譯”一詞,由古圖拉特(Couturat)和洛(Leau)1903年在《通用語(yǔ)言的歷史》一書(shū)中最早提出。1949年,韋弗發(fā)表了具有廣泛影響力的名為《翻譯》的備忘錄,正式提出了機器翻譯的思想。直到2006年Hinton提出深度學(xué)習技術(shù),才為實(shí)現這一目標提供了更好的解決途徑。目前的前沿技術(shù)是基于人工神經(jīng)網(wǎng)絡(luò )的機器學(xué)習,其技術(shù)核心是一個(gè)擁有海量節點(diǎn)(神經(jīng)元)的深度神經(jīng)網(wǎng)絡(luò ),可以自動(dòng)地從語(yǔ)料庫學(xué)習翻譯知識。一種語(yǔ)言的句子被向量化之后,在網(wǎng)絡(luò )中層層傳遞,轉化為計算機可以“理解”的表示形式,再經(jīng)過(guò)多層復雜的傳導運算,生成另一種語(yǔ)言的譯文。
2015年,蒙特利爾大學(xué)引入注意力機制,使得神經(jīng)機器翻譯達到實(shí)用階段。此后,神經(jīng)機器翻譯不斷取得進(jìn)展。2016年,谷歌GNMT發(fā)布,該系統可模仿人腦的神經(jīng)思考模式,翻譯出與人工翻譯相媲美的譯文。同年,微軟在Switchboard對話(huà)語(yǔ)義識別達到人類(lèi)水平,訊飛上線(xiàn)NMT系統,神經(jīng)機器翻譯開(kāi)始被大規模應用??茖W(xué)雜志Nature梳理了2016年科技領(lǐng)域的十大突破,排在首位的就是人工智能,其中提及人工智能的機器翻譯使錯誤減少了約60%。隨后,Facebook的人工智能研究團隊開(kāi)發(fā)了一種新的神經(jīng)機器翻譯算法,在三種機器翻譯任務(wù)上得分高于所有同類(lèi)系統。2017 年,微軟在斯坦福問(wèn)答數據集 SQuAD 上達到人類(lèi)水平。機器翻譯的發(fā)展速度遠遠超出人們的想象,但是對于機器翻譯是否能夠真正完全代替人工翻譯,學(xué)界仍舊爭論不休。
機器翻譯取代人工翻譯沈陽(yáng)翻譯公司
目前而言,一部分專(zhuān)家認為機器翻譯很快會(huì )達到人工翻譯水平,在不遠的將來(lái)會(huì )完全取代人工翻譯。2010年,谷歌機器翻譯專(zhuān)家歐赫認為文本機器翻譯是合理有效的,真正的挑戰只在語(yǔ)音識別方面。他提出,未來(lái)幾年即有可能實(shí)現手機端語(yǔ)音到語(yǔ)音的自動(dòng)翻譯。2019年2月《衛報》刊登《機器翻譯的時(shí)代是否已經(jīng)到來(lái)》一文,美國韋弗利實(shí)驗室(Waverly Labs)的安德魯·奧喬亞表示“在未來(lái)十到十二年內,機器翻譯技術(shù)可與人工翻譯相媲美,甚至超過(guò)人工翻譯的水平”。
專(zhuān)家們對于機器翻譯的信心來(lái)自最新一代的翻譯技術(shù)——神經(jīng)網(wǎng)絡(luò )翻譯。神經(jīng)網(wǎng)絡(luò )翻譯打造的機器翻譯系統,采用了一系列新的學(xué)習手段來(lái)模擬人工翻譯。首先,利用人工智能任務(wù)的天然對稱(chēng)性進(jìn)行對偶學(xué)習。當訓練集中的一個(gè)中文句子被翻譯成英文后,系統會(huì )將相應的英文結果再翻譯回中文,并與原始的中文句子進(jìn)行比對,進(jìn)而從這個(gè)比對結果中學(xué)習有用的反饋信息,對機器翻譯模型進(jìn)行修正。其次,利用推敲網(wǎng)絡(luò ),模擬人們寫(xiě)作時(shí)不斷推敲、修改的過(guò)程。這樣,通過(guò)多輪翻譯,不斷地檢查、完善翻譯的結果,使翻譯的質(zhì)量得到大幅提升。再次,采用聯(lián)合訓練的方法迭代改進(jìn)翻譯系統。用中英翻譯的句子對去補充反向翻譯系統的訓練數據集,同樣的過(guò)程也可以反向進(jìn)行。最后,采用一致性規范讓翻譯可以從左到右進(jìn)行,也可以從右到左進(jìn)行,最終讓兩個(gè)過(guò)程生成一致的翻譯結果。這一系列技術(shù)有效模仿了人工翻譯的過(guò)程,極大提升了機器翻譯的整體質(zhì)量。
除此之外,機器翻譯相關(guān)學(xué)科之間的互動(dòng)更加頻繁,合作更加緊密。翻譯界和技術(shù)界都呈現出了更大的包容性,相關(guān)人士達成一定共識,即過(guò)去那種把語(yǔ)言學(xué)家排除在外,僅依賴(lài)技術(shù)界,埋頭做數據、分析開(kāi)發(fā)系統的做法是不可取的。在語(yǔ)言學(xué)和翻譯學(xué)領(lǐng)域,越來(lái)越多的人開(kāi)始關(guān)注機器翻譯,對技術(shù)應用探索也不再一味抵觸,開(kāi)始從用戶(hù)和市場(chǎng)需求的角度來(lái)客觀(guān)看待不同層級和不同受眾的語(yǔ)言服務(wù),計算機輔助翻譯在專(zhuān)業(yè)翻譯領(lǐng)域發(fā)揮著(zhù)越來(lái)越重要的作用。
機器翻譯技術(shù)仍備受質(zhì)疑沈陽(yáng)翻譯公司
對于現有的機器翻譯技術(shù),很多學(xué)者也表示質(zhì)疑。一方面,他們認為機器翻譯的廣泛適用性還有待考察。盡管機器翻譯在某些測試中正確率較高,而且在某些領(lǐng)域接近或超過(guò)人工譯員,但是這些測試只是針對特定范圍的文本,要想達到測試水平,必須滿(mǎn)足對于源語(yǔ)言和環(huán)境的苛刻要求。在筆譯方面,馮志偉在《機器翻譯研究》中表示,目前的機器翻譯系統對普通文本的翻譯在可讀性和準確性方面離人們的實(shí)際需求還有相當大的距離。機器翻譯系統對普通文本的翻譯,通常需要大量的譯后審校工作才能使譯文達到出版的要求,所花費的時(shí)間和費用往往會(huì )超過(guò)純人工翻譯。在口譯方面,中國科學(xué)院自動(dòng)化研究所宗成慶在《機器翻譯的夢(mèng)想與現實(shí)》中指出,在日??谡Z(yǔ)對話(huà)中,目前口語(yǔ)機器翻譯僅能對資源較為充分的語(yǔ)言(如英漢、日漢等),在說(shuō)話(huà)場(chǎng)景不是非常復雜、口音基本標準、語(yǔ)速基本正常、使用詞匯和句型不是非常生僻的情況下,可基本滿(mǎn)足正常交流的需要。