導(dǎo)讀:許多現(xiàn)代智能手機所采用的復(fù)雜人臉識別技術(shù)有朝一日可能會得到高科技升級,其聲音和外觀都出人意料地低技術(shù)含量。
許多現(xiàn)代智能手機所采用的復(fù)雜人臉識別技術(shù)有朝一日可能會得到高科技升級,其聲音和外觀都出人意料地低技術(shù)含量。這扇通向未來的窗戶只不過是一塊玻璃,美國威斯康辛大學(xué)麥迪遜分校的工程師們發(fā)明了一種制造“智能”玻璃的方法,這種玻璃可以在不需要任何傳感器、電路或電源的情況下識別圖像。
威斯康辛大學(xué)麥迪遜分校電子與計算機工程學(xué)教授余宗福說:正在利用光學(xué)技術(shù)將攝像機、傳感器和深層神經(jīng)網(wǎng)絡(luò)正常設(shè)置濃縮成一塊薄薄的玻璃。其研究成果發(fā)表在《光子學(xué)研究》上(包括概念驗證研究的細節(jié))。將人工智能嵌入惰性物體中,乍一看,這個概念似乎出自科幻小說。然而,這一進步可能為低功耗電子產(chǎn)品開辟新的領(lǐng)域?,F(xiàn)在,每當(dāng)你用人臉識別解鎖手機時,人工智能就會占用大量的計算資源(和電池壽命),這與機器視覺的典型路線完全不同,研究人員設(shè)想了一些看起來像半透明方塊的玻璃。
玻璃中巧妙放置的微小氣泡和雜質(zhì)會以特定方式彎曲光線,以區(qū)別于不同的圖像。這就是人工智能的作用。為了證明其概念,工程師們設(shè)計了一種方法來制造識別手寫數(shù)字的玻璃碎片。從數(shù)字圖像中發(fā)出的光從玻璃的一端進入,然后聚焦到玻璃另一端的九個特定點中的一個,每個點對應(yīng)一個數(shù)字,當(dāng)手寫的3變成8時,這種玻璃的動態(tài)足以實時檢測到。實驗室研究生Erfan Khoram感嘆到:研究能夠用如此簡單的結(jié)構(gòu)得到如此復(fù)雜的行為,這真的很了不起。
設(shè)計這種能識別數(shù)字的玻璃類似于機器學(xué)習(xí)訓(xùn)練過程,只是工程師們“訓(xùn)練”的是一種模擬材料,而不是數(shù)字代碼。具體來說,工程師們將不同大小和形狀的氣泡以及像石墨烯這樣的小塊吸光材料放置在玻璃內(nèi)的特定位置。
雖然已經(jīng)習(xí)慣了數(shù)字計算,但這拓寬了我們的視野,光傳播的波動力學(xué)為模擬人工神經(jīng)計算提供了一種新的方法這樣做的一個好處是,計算是完全被動的,是材料固有的,這意味著一塊圖像識別玻璃可以被使用數(shù)十萬次??赡軙堰@種玻璃用作生物特征鎖,只識別一個人的臉。
一旦建成,它將永遠不需要電力或互聯(lián)網(wǎng),這意味著它可以在數(shù)千年后為你保存一些安全的東西。此外,它以光速工作,因為玻璃通過扭曲光波來區(qū)分不同的圖像。雖然前期的培訓(xùn)過程可能會很耗時,而且需要計算,但這種玻璃本身制作起來很容易,成本也不高。在未來,研究人員計劃確定他們的方法是否適用于更復(fù)雜的任務(wù),比如面部識別。這項研究的合作者、哥倫比亞大學(xué)統(tǒng)計學(xué)教授袁明(音譯)說:這項技術(shù)的真正力量在于它能夠在不消耗任何能源的情況下,即時處理復(fù)雜得多的分類任務(wù)。
這些任務(wù)是創(chuàng)造人工智能的關(guān)鍵:如教無人駕駛汽車識別交通信號,在消費設(shè)備中啟用語音控制,以及其他許多例子。與人類視覺不同的是,智能玻璃具有令人難以置信的廣泛性,它能夠識別數(shù)不清的不同物體。與人類視覺不同的是,智能玻璃能夠在特定的應(yīng)用領(lǐng)域表現(xiàn)出色——例如,一塊用于識別數(shù)字,一塊用于識別字母,另一塊用于識別人臉等等,并設(shè)想應(yīng)用特定、任務(wù)驅(qū)動的技術(shù),這幾乎改變了我們設(shè)計機器視覺的一切。