導讀:猶記 2016 年,我在漢諾威參加德國漢諾威消費電子、信息及通信博覽會( CEBIT )時,我發(fā)現(xiàn)會上充斥著的那些所謂 “ 智能 ” 的東西并不怎么 “ 智能 ”—— 它們的功能幾乎都只是將兩個設備鏈接起來,并且在大多數(shù)情況下,僅僅提供單一的用途,用戶效益十分有限。
猶記 2016 年,我在漢諾威參加德國漢諾威消費電子、信息及通信博覽會( CEBIT
)時,我發(fā)現(xiàn)會上充斥著的那些所謂 “ 智能 ” 的東西并不怎么 “ 智能 ”——
它們的功能幾乎都只是將兩個設備鏈接起來,并且在大多數(shù)情況下,僅僅提供單一的用途,用戶效益十分有限。
例如:可以遠程監(jiān)控、 “ 開、關 ” 的管道閥門、能夠辨別運送司機是否偷運燃料的汽油體積測量裝置、通過 wi-fi 控制電源插頭。
然而,在 CEBIT 大會上,真正給我留下深刻印象的是IBM展示的一項研究項目 SyNAPSE 。這影響了我對未來人工智能發(fā)展的看法。 SyNAPSE 項目旨在開發(fā)一種人工智能芯片 “TrueNorth”—— 它能提供相當于螞蟻大腦的計算能力,同時只消耗 73mM 的能量。不過,這在當時每一個元件需要耗費 100 萬美元。
這意味著將人工智能與邊緣計算結合起來是可能的。同樣,要不了幾年 “ 摩爾定律 ” 也將會失效。問題只在于多久能夠實現(xiàn),以及多少其他類似的解決方案會出現(xiàn)在市場上?早在 2016 年, Neuron soundware 已經(jīng)開始采取物聯(lián)網(wǎng)戰(zhàn)略 —— 在網(wǎng)絡邊緣運行人工智能算法 —— 并且決定開發(fā)自己的具有錄音和人工智能處理功能的物聯(lián)網(wǎng)邊緣設備。
幾個月后,我根據(jù)能量消耗和智能計算之間的關系制作了一張圖表。
這顯示了智能與能耗的相關性。
● 只有幾毫瓦,不可能以合理的價格達到智能;
● 智能手機的能量消耗為幾瓦,并且可以為基本的人工智能提供足夠的計算能力 —— 每隔一秒左右從圖像中識別目標;
● 限制領域人工智能( narrow AI ),比如駕駛汽車的能力,需要消耗幾十或幾百瓦的電力。
用于分析的攝像機每秒輸入 10 次左右,大約需要每秒 4 萬億次浮點運算。
所以,想要用相同的計算性能來駕駛汽車或按順序分析機器聲音從而檢測潛在的機械故障。完成這兩個工作都需要相當于螞蟻大腦的計算能力。 IBM 推出的 ultra-low-energy-consuming 芯片,讓我看到了實現(xiàn)這種能力的可能。
邊緣計算的興起
從那時起,邊緣計算能力一直在提高。
2017 年,為了擴展低性能的計算設備, Movidius 神經(jīng)計算棒以低于 100 美元的價格,僅需 0.5W 的電量便能進行每秒一千億次浮點計算。
2018 年,華為推出了麒麟 980 處理器,在 0.1W 的電量下可以完成每秒五千億次的浮點計算。其他供應商緊隨其后。谷歌發(fā)布了 Edge TPU Units ,瑞芯微( Rockchip )公布了 RK3399 。這兩個約每秒能夠處理 3 萬億次浮點計算,成本在 100 美元左右。
2019 年,帶有人工智能技術硬件加速器(特別是神經(jīng)網(wǎng)絡)的特定微型計算機得到普遍使用。所有關鍵的硬件廠商都陸續(xù)發(fā)布了 AI 軟件棧的邊緣優(yōu)化版本,這進一步提高了性能。目前,一般使用的 AI 板有,谷歌的 Edge TPU—— 使用專門的 ASIC 芯片制作而成用以處理 AI 的預測推理功能。價格低于 100 美元的英偉達 Jetson Nano 配備了 128 個英偉達 CUDA 核心。瑞芯微發(fā)布的 RK3399 Pro—— 第一個帶有神經(jīng)網(wǎng)絡處理器的開發(fā)板(其性能甚至略優(yōu)于英偉達 Jetson Nano )。
物聯(lián)網(wǎng)技術的大幅提高讓我們得以發(fā)展 nBox—— 這款邊緣計算設備不僅能夠借助多達 12 個通道記錄高質量音頻,并且還可以通過邊緣計算實現(xiàn)人工智能。所謂邊緣計算,是指大多數(shù)處理過程將通過本地設備實現(xiàn)而無需交由云端完成。
隨著英特爾( Intel )以約 4 億美元收購 Movidius ,以及超過 133.8 億歐元收購自動汽車芯片制造商 Mobileye ,邊緣計算的重要性變得顯而易見。
特斯拉汽車公司( Tesla Motors )在網(wǎng)上展示了他們?yōu)槠渥詣玉{駛汽車特意打造的 AI 高性能計算機 —— 每秒能夠完成 36 萬億次浮點計算,這足以每秒處理汽車攝像頭中 2000 多張高分辨率圖像,特斯拉表示這它的性能完全能夠實現(xiàn)自動駕駛。
邊緣計算四個主要優(yōu)勢
1 、安全:所有處理過的數(shù)據(jù)都可以存儲在本地,并且有嚴格的控制。
2 、速度:人工智能推理系統(tǒng)能夠以毫秒為單位處理輸入,這意味著最小的延遲。
3 、效益:嵌入式微型計算機功耗低,價格實惠。
4 、離線:由于人工智能算法部署位置的特殊性,不需要占用太多的網(wǎng)絡寬帶。
邊緣計算相對于5G,優(yōu)勢何在?
也許你會問為什么這么多的硬件廠家如此大費周章?為什么不坐等 5G 網(wǎng)絡或者利用豐富的云計算能力和基礎設施?以下是一些答案。
● 想象一下,你正坐在一輛自動駕駛汽車里,汽車突然斷開了 5G 網(wǎng)絡。這時,汽車不僅會 “ 失明 ” ,而且會喪失決策能力。當高帶寬和低延遲通信所需的計算能力實際上與一個額外的神經(jīng)處理單元的成本相同時,為什么要冒這個風險呢?此外,它的總體耗能還會比利用特定硬件實現(xiàn)人工智能預測來的要高。
● 移動互聯(lián)網(wǎng)提供商希望將投資套現(xiàn)用于開發(fā)和部署 5G 網(wǎng)絡。盡管在技術上可能實現(xiàn)無限制大容量數(shù)據(jù)計劃,但它們并不會很快投入商業(yè)使用。例如, nBox 有 12 個聲學傳感器,每個月可以產生多達 1 TB 的音頻數(shù)據(jù)。按照 LTE 目前每 GB 的價格,將這么多數(shù)據(jù)傳輸?shù)皆朴嬎銓⒒ㄙM一大筆錢。
● 網(wǎng)絡覆蓋將主要建立在城市,這意味著其他很多地方接受不到 5G 信號。與此相反,邊緣計算設備可以隨即部署到任何需要的地方,只需要一次性的成本投入,并且這通常不會顯著增加物聯(lián)網(wǎng)解決方案的成本。
邊緣計算與人工智能相結合使得在本地處理大量數(shù)據(jù)成為可能。硬件加速器的額外成本其實微不足道。另外,神經(jīng)網(wǎng)絡的計算性能正以每年 10 倍左右的速度提高,并且,由于數(shù)據(jù)可以并行處理,這一趨勢似乎沒有放緩。
未來 “ 觸手可及 ”
邊緣計算在自動駕駛汽車、人臉識別、預見性維護等方面的應用只是一個開始。我們很快就會有足夠的計算能力來制造出真正獨立運行的機器。它們將能夠安全地在城市,工廠里運行,甚至像人類一樣勝任它們的工作。令人難以置信的是,捷克作家 Karel ? apek 早在一個世紀前就預見了這一點。到 2020 年,其科幻作品中出現(xiàn)的 “ 機器人 ” 一詞已經(jīng)是 100 年前的事情了。
他對 “ 類人機器人 ” 的設想很快傳遍了全世界。在這部科幻小說中,機器人擁有自我意識,并且能夠獲得類似于 “ 愛 ” 的感情??v觀計算機性能提高的速度以及其他物聯(lián)網(wǎng)的迅猛發(fā)展,我認為 Karel ? apek 設想的實現(xiàn)將比我們預期的還要快。