導(dǎo)讀:據(jù)介紹,聆語、小聰背后,整合了 3D 數(shù)字人建模、語音識別、語義理解、機(jī)器翻譯和圖像渲染技術(shù)等。
近日,騰訊發(fā)文表示,在央視頻的比賽播放中,央視頻 AI 手語翻譯官聆語為武大靖奪金時(shí)刻帶來了手語解說。此外,騰訊 3D 手語數(shù)字人小聰也將上線騰訊體育。
▲ AI 手語翻譯官聆語
據(jù)了解,騰訊表示,小聰、聆語,均由騰訊的技術(shù)團(tuán)隊(duì)打造,特點(diǎn)是:手語表達(dá)能力接近真人;能自行學(xué)習(xí),快速補(bǔ)充海量新詞、熱詞。近期,聆語、小聰會(huì)為冰雪賽事的轉(zhuǎn)播采訪等環(huán)節(jié),提供手語解說服務(wù)。
據(jù)介紹,聆語、小聰背后,整合了 3D 數(shù)字人建模、語音識別、語義理解、機(jī)器翻譯和圖像渲染技術(shù)等。
騰訊開發(fā)出了一套手語翻譯系統(tǒng),只需輸入健聽人語言,即可通過機(jī)器翻譯低延遲生成高準(zhǔn)確率的手語語言表征,比如:輸入“他是我的手語老師”,預(yù)處理為“他 是 我 的 手語 老師”,翻譯為“他 我 手語 老師 是”。
接著,驅(qū)動(dòng)手語數(shù)字人準(zhǔn)確表達(dá),基于騰訊多模態(tài)端到端生成模型,進(jìn)行聯(lián)合建模及預(yù)測生成高準(zhǔn)確率的動(dòng)作、表情、唇動(dòng)等序列,實(shí)現(xiàn)自然專業(yè)、易懂度高的手語效果。通過這項(xiàng)技術(shù),AI 手語可懂度達(dá) 90% 以上。