Facebook今天宣布它每天用神經(jīng)網(wǎng)絡(luò)處理翻譯超過(guò)45億次。Facebook用遞歸神經(jīng)網(wǎng)絡(luò)處理翻譯任務(wù),該網(wǎng)絡(luò)可以與Caffe2共用,也就是Facebook今年4月推出的開(kāi)源深度學(xué)習(xí)框架。Caffe2團(tuán)隊(duì)今天還說(shuō),由于在翻譯領(lǐng)域付出了許多努力,現(xiàn)在框架可以與遞歸神經(jīng)網(wǎng)絡(luò)協(xié)同工作。
團(tuán)隊(duì)在博客中表示:“有了Caffe2,我們明顯提高了Facebook機(jī)器翻譯系統(tǒng)的效率和質(zhì)量。效率提高了2.5倍,這樣我們就可以將神經(jīng)機(jī)器翻譯模型應(yīng)用于生產(chǎn)。最終,F(xiàn)acebook所有語(yǔ)言的所有的機(jī)器翻譯模型都由短語(yǔ)型系統(tǒng)轉(zhuǎn)向了神經(jīng)模型?!?/p>
使用遞歸神經(jīng)網(wǎng)絡(luò)使得BLEU提高了11%,BLEU是一個(gè)指標(biāo),用來(lái)評(píng)估機(jī)器翻譯人類(lèi)語(yǔ)言的表現(xiàn)。之前的翻譯是用短語(yǔ)型模型完成的,它不能翻譯文本塊,只能翻譯獨(dú)立單詞和短語(yǔ)。
Facebook應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)的成員在博客中表示:“為了彌補(bǔ)這個(gè)缺點(diǎn),開(kāi)發(fā)自己的神經(jīng)網(wǎng)絡(luò)系統(tǒng),我們從一開(kāi)始就使用了一種遞歸神經(jīng)網(wǎng)絡(luò),也就是序列到序列(Sequence-to-Sequence)LSTM(長(zhǎng)短記憶網(wǎng)絡(luò))。這種神經(jīng)網(wǎng)絡(luò)可以將源句子的整個(gè)語(yǔ)境、至今生成的一切考慮進(jìn)去,從而讓翻譯更精準(zhǔn)更流暢?!?/p>