技術(shù)
導(dǎo)讀:階躍星辰在公眾號(hào)宣布推出 Step-1o 千億參數(shù)端到端語音大模型,據(jù)稱是“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語音大模型”。
12 月 14 日消息,階躍星辰在公眾號(hào)宣布推出 Step-1o 千億參數(shù)端到端語音大模型,據(jù)稱是“國(guó)內(nèi)首個(gè)千億參數(shù)端到端語音大模型”。
據(jù)階躍星辰介紹,傳統(tǒng)的語音模型采用級(jí)聯(lián)方案,用戶輸入的語音信息需要先轉(zhuǎn)化為文本,再二次轉(zhuǎn)化成語音輸出,這個(gè)過程不僅會(huì)降低傳輸效率、更會(huì)在過程中折損掉包括情緒在內(nèi)的信息,導(dǎo)致語音模型時(shí)延長(zhǎng)反應(yīng)慢、回答質(zhì)量和智能水平不足、情感表達(dá)空洞刻板的缺陷。但端到端的語音方案,可以實(shí)現(xiàn)語音理解和生成的一體化,提升模型智商和情商的上限。
從官方介紹獲悉,Step-1o 支持語音、文本等混合形式的輸入和輸出,可以快速反應(yīng)并隨時(shí)打斷,它也能深度理解和模仿音色、韻律、方言、個(gè)性化的口語表達(dá)習(xí)慣等聲音特征;
Step-1o 能夠通過自學(xué)和模仿不斷提升回復(fù)質(zhì)量,既能提供解決問題的專業(yè)建議,也能作為提供高情緒價(jià)值的陪伴。此外,Step-1o 還傳承了階躍星辰語言大模型的創(chuàng)作能力。
階躍星辰透露,近期,Step-1o 將接入躍問 App 端,為用戶提供實(shí)時(shí)語音通話服務(wù)。