勵志

勵志人生知識庫

有道神經網路翻譯

網易有道在三個月前正式上線了其基於深度學習的神經網路翻譯模型(NMT),該模型通過模擬生物神經網路的方式,由大量的神經元組成,能夠完成一些比較初級的操作。模型通過對神經元奇妙的組織,使它能夠配合工作,完成更複雜的任務,和動物的神經網路工作方式比較類似。在神經網路翻譯模型中,對關鍵信息會用連續關鍵向量來表達,一個詞對應到翻譯裡面是一個高位向量,這樣做的好處在於比較強的刻畫力——刻畫信息之間的關係,比如同義詞或者反義詞,傳統用編碼方式不太容易表達,但是如果在一個向量空間來表達,通過向量之間的位置,就能比較好的來反映它們之間的關係。此外,有道的神經網路翻譯模型是端到端的模型,翻譯模型里有很多參數,這些參數為了共同的目標進行最佳化,和傳統的模型不一樣,傳統的機器學習會有各種模組,各個模組都是為自己的目標來調整最佳化的,人為拼湊成一個機器類的東西,能完成功能,但是比較生硬。對於神經網路翻譯模型的評估,有道採用了機器翻譯界通用的 BLEU(雙語評估研究-Bilingual Evaluation Understudy)評估指標,得分越高,說明翻譯結果越接近目標翻譯。除中英互譯之外,有道近日也上線了日韓語神經網路翻譯,從內部測試的 BLEU 數值上來看,中日、中韓翻譯準確度也都高於國內和國際同類產品。