JAPANESE酒醉侵犯,亚洲av无码一区二区二三区冫,亚洲欧美日韩视频高清专区,无码少妇一区二区三区免费

淘寶商鋪|免費(fèi)在線翻譯|English
杭州中譯翻譯有限公司同聲傳譯翻譯服務(wù)
請(qǐng)問您的會(huì)議在什么時(shí)間舉行?
需要進(jìn)行哪個(gè)語種的同傳?
您的位置:首 頁 >> 新聞公告 >> 行業(yè)資訊

阿里云PAI將神經(jīng)機(jī)器翻譯訓(xùn)練效率提升5倍

        近兩年,神經(jīng)機(jī)器翻譯(NMT: Neural Machine Translation)技術(shù)異軍突起,翻譯質(zhì)量取得大幅提升。但不幸的是,NMT系統(tǒng)的訓(xùn)練成本非常高,限制了這一技術(shù)的大范圍使用。


        7月12日,阿里巴巴披露的一份技術(shù)資料中顯示,阿里翻譯團(tuán)隊(duì)通過使用阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI實(shí)現(xiàn)了模型訓(xùn)練效率5倍的飛躍,并已應(yīng)用在英俄電商翻譯質(zhì)量優(yōu)化項(xiàng)目中。


        神經(jīng)機(jī)器翻譯是一種用于自動(dòng)翻譯的端到端的學(xué)習(xí)方法,該方法能夠克服傳統(tǒng)的基于短語的翻譯系統(tǒng)的缺點(diǎn),可以將整個(gè)輸入句子視作翻譯的基本單元。從2016年以來的學(xué)術(shù)界頂級(jí)會(huì)議上,幾乎全是圍繞NMT相關(guān)的創(chuàng)新工作,之后谷歌、微軟等巨頭公司相繼發(fā)布NMT系統(tǒng)。


        在阿里巴巴內(nèi)部,阿里翻譯負(fù)責(zé)為1688國際站、全球速賣通等提供多語言服務(wù),中國賣家填寫的一些中文信息會(huì)被機(jī)器自動(dòng)翻譯成多國語言。該團(tuán)隊(duì)同時(shí)還為釘釘、東南亞電商Lazada等提供服務(wù)。


        去年,他們首次將NMT技術(shù)應(yīng)用在通訊場景下。雖然翻譯質(zhì)量取得很大的提升,但模型訓(xùn)練耗時(shí)太長。3000萬的訓(xùn)練數(shù)據(jù)在單塊GPU卡上一般需要訓(xùn)練20天以上,才能得到一個(gè)初步可用的模型。


        之后,他們嘗試在阿里云機(jī)器學(xué)習(xí)平臺(tái)PAI上開發(fā)支持分布式訓(xùn)練的NMT系統(tǒng),并于3月底完成了第一個(gè)版本。在英俄電商翻譯質(zhì)量優(yōu)化項(xiàng)目中,分布式NMT系統(tǒng)大大提高了訓(xùn)練速度,使模型訓(xùn)練時(shí)間從20天縮短到了4天。


        PAI是阿里“NASA”計(jì)劃發(fā)布的首個(gè)重磅工具,可完全兼容全球主流的深度學(xué)習(xí)開源框架。同時(shí),底層提供強(qiáng)大的云端異構(gòu)計(jì)算資源,包含CPU、GPU、FPGA。在GPU方面,可靈活實(shí)現(xiàn)多卡調(diào)度。


        在阿里巴巴內(nèi)部,PAI已經(jīng)被廣泛使用。淘寶搜索使用PAI的參數(shù)服務(wù)器,可以把百億個(gè)特征的模型,分散到數(shù)十個(gè)乃至于上百個(gè)參數(shù)服務(wù)器上,打破規(guī)模瓶頸。最終實(shí)現(xiàn)搜索結(jié)果基于商品和用戶的特征進(jìn)行排序。


        現(xiàn)在,阿里翻譯團(tuán)隊(duì)還在破解線上服務(wù)處理延時(shí)的難題,為神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型的大規(guī)模應(yīng)用掃除最后障礙


 

分享到:QQ空間新浪微博騰訊微博人人網(wǎng)微信

相關(guān)文章: