導(dǎo)讀:火山翻譯新增38種罕見語言翻譯,現(xiàn)在,火山翻譯包含94種+8742種語言。據(jù)火山翻譯團(tuán)隊(duì)透露,火山翻譯雙語翻譯模式下僅需30天完成76個(gè)語言訓(xùn)練。
12月31日消息:2021年12月,字節(jié)跳動(dòng)旗下的火山翻譯官方網(wǎng)站增加了38種罕見語言的新翻譯,包括世界語、塔希提語和韃靼語。目前,火山翻譯具備94種語言和8742種語言,包括漢語英語、阿拉伯語、俄語、法語、西班牙語,整體bleu (機(jī)器翻譯質(zhì)量自動(dòng)評(píng)價(jià)指標(biāo)) 達(dá)到33.45,處于行業(yè)領(lǐng)先水平。
據(jù)了解,通過自行開發(fā)的mRASP多語言模型,火山翻譯僅使用一個(gè)模型就完成了上述38種語言與英語之間的雙向翻譯,它突破了傳統(tǒng)的雙語翻譯模式,分別訓(xùn)練每種語言,分別推出服務(wù),大大降低了機(jī)器學(xué)習(xí)的培訓(xùn)和服務(wù)成本。
“一般來說,訓(xùn)練76個(gè)語言雙語模型需要150-200天。在相同的硬件條件下,訓(xùn)練多語言模型只需30天。”火山翻譯團(tuán)隊(duì)介紹,“對(duì)于小請(qǐng)求的語言,使用mRASP模型集中式服務(wù)可以大大節(jié)省計(jì)算資源,只有一半的用于深度學(xué)習(xí)培訓(xùn)的Tesla T4顯卡能夠滿足38種語言的所有翻譯要求,與雙語翻譯所需的資源相同。“
目前,火山翻譯有三大產(chǎn)品:火山同傳、機(jī)器翻譯和視頻翻譯,支持飛書、今日頭條、西瓜視頻等業(yè)務(wù)的翻譯需求,并通過字節(jié)跳動(dòng)旗下的企業(yè)級(jí)技術(shù)服務(wù)平臺(tái)火山引擎對(duì)外提供翻譯服務(wù)。
不知道大家有沒有用過這三種火山產(chǎn)品,而火山翻譯的使用是不是真的向火山翻譯團(tuán)隊(duì)介紹的那樣呢,這個(gè)疑問還是等大家去體驗(yàn)之后再來公布吧。