應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

XMOS人工智能降噪——AI降噪讓極端嘈雜環(huán)境下的通話和拾音變得可能

2025-04-21 15:42 北京華興萬邦管理咨詢有限公司
關(guān)鍵詞:XMOSAI降噪DNN算法

導(dǎo)讀:AI驅(qū)動的語音捕獲功能,可在各種極具挑戰(zhàn)性的環(huán)境中用深度神經(jīng)網(wǎng)絡(luò)(DNN)算法來降噪

前兩篇,我們分別介紹了空間音頻技術(shù)——該解決方案能夠在包括數(shù)字耳機等在內(nèi)的任何設(shè)備上提供3D沉浸式空間音頻,而且可以實現(xiàn)更安全地聆聽,和高音質(zhì)低延遲聲卡解決方案——具有實時音頻DSP處理的低延遲音頻設(shè)備,可以全面提升游戲和直播的聽覺感受。本篇介紹人工智能(AI)降噪——AI驅(qū)動的語音捕獲功能,可在各種極具挑戰(zhàn)性的環(huán)境中使用深度神經(jīng)網(wǎng)絡(luò)(DNN)算法來降噪。

正在快速發(fā)展的人工智能、物聯(lián)網(wǎng)和邊緣計算等技術(shù)正在全面改變我們的生活和工作,也給XMOS及其客戶帶來了許多新的機會。早在去年,XMOS就提到,XMOS認(rèn)為目前幾乎所有曾經(jīng)由傳統(tǒng)數(shù)字芯片控制的市場都在向智能化轉(zhuǎn)型,因此智能化帶來了對各種邊緣計算的需求。XMOS開發(fā)的集可定義AI、DSP、MCU和I/O資源于一芯的軟件定義SoC,成為了可支持多種邊緣計算設(shè)備的高性能、高靈活性解決方案。例如即使在非常傳統(tǒng)的音頻技術(shù)領(lǐng)域,采用邊緣智能技術(shù)也可以取得優(yōu)異的產(chǎn)品優(yōu)勢和可觀的市場成績。

在音頻設(shè)備的設(shè)計與性能提升方面, AI技術(shù)也帶來了顛覆性的創(chuàng)新機會。尤其是在噪聲消除領(lǐng)域,AI技術(shù)的應(yīng)用正在逐步改變我們用聲音來互動的方式。近年來,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等AI技術(shù)的發(fā)展,為音頻降噪帶來了新思路和新方法。采用神經(jīng)網(wǎng)絡(luò)算法降噪是一種基于深度學(xué)習(xí)的音頻降噪技術(shù),其通過對大量的訓(xùn)練樣本進行學(xué)習(xí),實現(xiàn)對噪聲的自動去除。

神經(jīng)網(wǎng)絡(luò)方法可以利用非線性的多層結(jié)構(gòu),對噪聲信號進行特征提取和去噪處理,從而實現(xiàn)音頻降噪。XMOS所提供的AI降噪,是一種AI驅(qū)動的語音捕獲功能,可在各種極具挑戰(zhàn)性的環(huán)境中實現(xiàn)用(DNN)來降噪。

我們一起來看看——

 

人工智能降噪——AI驅(qū)動的語音捕獲功能,可在各種極具挑戰(zhàn)性的環(huán)境中用深度神經(jīng)網(wǎng)絡(luò)(DNN)算法來降噪

XMOS的AI加速技術(shù)通過先進的算法來提供降噪功能,以實時方式智能化地去除背景噪聲,從而確保在極具挑戰(zhàn)性的環(huán)境中也能夠清晰地捕獲音頻。適用于專業(yè)和工業(yè)應(yīng)用。

XMOS解決方案的特性

  • 1-4個麥克風(fēng)陣列遠場語音

  • 可提供超級指向性定向波束的自適應(yīng)波束形成器

  • 回聲消除器

  • 回聲與噪聲抑制

  • 人工智能降噪和強大的去混響能力

  • 可選的熱詞(關(guān)鍵詞)偵測器

XMOS解決方案的優(yōu)勢

  • 噪聲環(huán)境下的高魯棒性語音檢測(負(fù)信噪比)

  • 用于高質(zhì)量通信的噪聲抑制

  • 與ASR引擎接口連接用于語音控制

為什么選擇XMOS?

  • 在同一顆芯片上集成了I/O +音頻DSP + AI功能

  • 利用深度神經(jīng)網(wǎng)絡(luò)算法進行語音處理

“XMOS是唯一一家能夠快速運行原生DNN代碼的芯片公司,可以實現(xiàn)片上音頻增強,同時該芯片還能夠提供合適的音頻接口選項(如USB、I2S等)。這是一個加分項。” Fraunhofer IDMT的Jan Wellman講到。

該方案立即可應(yīng)用的設(shè)備?

  • 智能門鈴/對講機

  • 工業(yè)免提通信和控制

  • 基于聲學(xué)的監(jiān)測設(shè)備

  • 語音使能的設(shè)備

系統(tǒng)框圖

目前,XMOS的智能音頻技術(shù)和方案已經(jīng)被廣泛應(yīng)用于消費電子、智能家居、智能汽車和辦公應(yīng)用,不僅為各種終端和系統(tǒng)提供了高質(zhì)量的音頻和音效,而且作為無所不在的人機接口和新興生產(chǎn)力工具幫助這些應(yīng)用連入各種網(wǎng)絡(luò)和云生態(tài)。

如希望了解XMOS全球領(lǐng)先的音頻解決方案、軟件定義SoC及其在其他垂直行業(yè)的應(yīng)用,或與我們合作共同開發(fā)面向全球的創(chuàng)新性產(chǎn)品,請發(fā)郵件到:ThomasMu@xmos.com