應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

Marvel.AI幫名人合成語音,讓他們躺著也掙錢

2021-05-19 08:52 智東西

導(dǎo)讀:隨著機器學(xué)習技術(shù)的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉(zhuǎn)語音的模型。

近日美國一家人工智能公司Veritone推出了一款名叫Marvel.AI的聲音平臺,為名人提供聲音克隆服務(wù)。

公司總裁Ryan Steelberg說:“對于名人而言,除了使用個人形象的廣告代言,他們的聲音也是工作業(yè)務(wù)的一部分,但通常名人們的時間比較緊張,沒有足夠的時間去演播室錄音”。所以,Veritone公司就推出了這項服務(wù),幫助名人們生成他們聲音的深層復(fù)制品(deepfakes of their voices),并在需要的時候使用。

一、Marvel.AI兩種服務(wù)模式:可自助,可個性化定制

隨著機器學(xué)習技術(shù)的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉(zhuǎn)語音的模型。但機器語音太過生硬,為了制作出精品的人聲語音系統(tǒng),Veritone作為世界首個人工智能操作系統(tǒng)aiWare的創(chuàng)建者,最近搭建了Marvel.AI語音平臺,該平臺可以制作合成語音,讓內(nèi)容創(chuàng)作者、名人等用戶生成他們聲音的復(fù)制品,以達到難辨真?zhèn)蔚娜寺曅Ч?,用于電臺、有聲讀物或是其他平臺的應(yīng)用。

對用戶而言,Marvel.AI將提供兩種服務(wù)。

第一種是自助服務(wù)模式,人們可以從原有的聲音目錄中選擇自己的喜歡的模型,然后根據(jù)需要創(chuàng)建語音。這種模式類似于亞馬遜和微軟等公司之前提供的變音服務(wù)。

第二種是個性化制定模式,客戶只需要提交自己的聲音數(shù)據(jù)。之后,Veritone本著“一切為了顧客服務(wù)”的原則,為他們創(chuàng)建一個克隆的語音模型,并保存在公司的系統(tǒng)中。只要客戶有需求,就能立刻把模型調(diào)出開始復(fù)制使用。Marvel.AI還將搭建一個市場,為那些有潛在需求的客戶,提供多樣化的聲音模型選擇,但目前其定價不明確。

Steelberg堅信,對這此類服務(wù)市場是有需求的,他們已經(jīng)準備好商業(yè)化應(yīng)用了。

二、為名人省時省力,但存在信用風險

Veritone雖然自稱是一家“人工智能公司”,但其大部分收入來自廣告和內(nèi)容授權(quán)。該公司有個Veritone Licensing部門,對包括CBS和CNN等在內(nèi)的廣播公司,以及NCAA和美國網(wǎng)球公開賽等體育組織擁有的視頻檔案進行授權(quán)。

Ryan Steelberg說聲稱,與那些專注于人工智能技術(shù)的初創(chuàng)公司相比,Veritone在授權(quán)和廣告方面的經(jīng)驗將賦予其優(yōu)勢。但這對廣告商和贊助商來說,無疑是非常耗錢又費時的項目。畢竟,名人都是靠自身形象、聲音來引流的,但當大眾粉絲們發(fā)現(xiàn),自己的偶像或是崇拜者連聲音都是合成的,那之后還會消費其代言的產(chǎn)品嗎?

三、克服機械音、提高安全度是Veritone的發(fā)展重點

近年來,在廣告領(lǐng)域,語音合成技術(shù)被廣泛應(yīng)用。在這波語音創(chuàng)作洪流中,Veritone平臺的發(fā)展取決于合成人聲的真實性。它是否能帶動大眾的情緒,聲音聽起來要像是人類發(fā)出的,而不是機器。

此外,對于這項技術(shù),在社會上也存在諸多爭議。由于Marvel.AI可以創(chuàng)建任何音頻模型,這就給個人隱私泄露和音頻濫用問題的出現(xiàn)提供了可能。例如之前出現(xiàn)的不法之徒,利用語音合成來進行電話詐騙的案例,讓語音克隆服務(wù)的安全度遭到質(zhì)疑。

Steelberg也曾提到,通過復(fù)制音頻檔案,該項技術(shù)能夠讓已經(jīng)逝世人的聲音“復(fù)活”。從技術(shù)層面上看,這是一項不錯的創(chuàng)新技術(shù);但從道德角度上看,這確實有點讓人感到毛骨悚然。比如通過人工智能復(fù)活英國戴安娜王妃的語音,用于商品代言,消費者們會買單嗎?

結(jié)語:智能語音發(fā)展的同時,也要保障用戶安全

在全面進入數(shù)字化的時代,智能語音服務(wù)是未來的發(fā)展趨勢,從智能語音客服到廣告行業(yè)的人聲合成語音,都有著潛在的發(fā)展市場。

但在研發(fā)克隆語音服務(wù)的同時,負責技術(shù)開發(fā)的科技公司,應(yīng)更加重視服務(wù)帶來的用戶隱私和安全問題。在智能語音行業(yè),各大科技企業(yè)使該技術(shù)商業(yè)化的同時,需不斷地規(guī)范市場化運作,保障用戶權(quán)益。

來源:Gizmodo