導讀:最近幾年,人工智能(AI)已成為非常流行的熱點話題。在過去的二十年中,人類在計算能力、數(shù)據(jù)積累、數(shù)學工具的改進方面取得了巨大進步,并且所有這些的成本進一步降低,由此人工智能誕生。
最近幾年,人工智能(AI)已成為非常流行的熱點話題。在過去的二十年中,人類在計算能力、數(shù)據(jù)積累、數(shù)學工具的改進方面取得了巨大進步,并且所有這些的成本進一步降低,由此人工智能誕生。
為了使機器能夠更好的理解它周圍的世界,人工智能技術受生物學的啟發(fā),延伸出兩個重要方向:許多研究集中于提升應用智能視覺系統(tǒng)分析圖像的能力;以及,允許機器分析這些圖像的數(shù)學結構:人工神經(jīng)網(wǎng)絡,即人腦的微型結構拷貝。
人工神經(jīng)網(wǎng)絡,常用的研究方法包括神經(jīng)元之間連接的拓撲結構、所使用的聚合函數(shù)、閾值函數(shù)和反向傳播方法(如果存在的話,這種網(wǎng)絡被稱為卷積神經(jīng)網(wǎng)絡,簡稱CNN)。這些數(shù)學方法都是人工智能領域的一部分,稱為“深度學習”。
在過去的十年中,深度學習在很多領域都非常成功。尤其在圖像的技術領域,面部識別、虹膜和手勢監(jiān)控、物體和自由空間檢測,以及最近的行為識別解決方案均是深度學習技術的杰作。
同時,我們看到基于深度學習的智能視覺技術在智能汽車領域獲得了最引人注目的進步,這些技術被用于ADAS(先進的駕駛員輔助系統(tǒng)),用于檢測障礙物和識別標志、交通燈、汽車、行人和各種各樣的其它物體。圖像來源于部署在智能汽車周圍的一組相機,而訓練是在專用計算機中的數(shù)據(jù)中心執(zhí)行的。在半自動駕駛汽車中,推理算法嵌入在ECU(發(fā)動機控制單元)中;在機器人或全自動駕駛汽車中,推理算法嵌入在一個完整的計算機中。
生物特征識別是廣泛應用智能視覺技術的另一個主要領域,例如,將智能視覺算法用于個人身份認證。蘋果具備3D面部識別功能的最新手機iPhone X,就是一個很明顯的例子;在智能監(jiān)控和國土安全領域,面部識別被用于邊界控制,以及使用專門的相機生產(chǎn)身份證件。用于個人身份認證的基于深度學習的智能視覺技術,也越來越多地被用于移動設備中。未來,我們還可以在移動設備中增加行為識別功能,這項功能目前仍處于研究和開發(fā)階段,但已經(jīng)取得了鼓舞人心的初步成果。
在過去的十年中,谷歌、亞馬遜、Facebook和蘋果在人工智能領域的投資驚人的一致。市場研究公司Yole預測,到2025,AI市場將以50%的年復合增長率(CAGR)增長,收入主要集中在使用智能視覺技術上。
人工智能的發(fā)展也離不開專門的硬件的開發(fā)。值得注意的是,視覺處理器的設計者和建造者,還通過嵌入式操作系統(tǒng)和/或SDK(軟件開發(fā)工具包)提供軟件層。這樣就能很容易地實施軟件解決方案,并允許硬件最大限度地發(fā)揮功能,同時還要求特定平臺開發(fā)技能,需要使用如Arm的embedOS、NVIDIA的Jetson、Xilinx的XSDK以及CEVA公司的CDNN等工具。
為嵌入式系統(tǒng)開發(fā)AI的公司,在開發(fā)其解決方案并設計與眾不同類型的硬件兼容時,必須考慮這個強加的軟件層。
隨著AI的勢頭持續(xù)高漲,AI在智能視覺系統(tǒng)中的應用呈現(xiàn)出非常光明的未來。在硬件方面,已經(jīng)出現(xiàn)了專用處理器;在軟件方面,有越來越強大的算法,能夠識別物體、面部和姿勢。從AI的市場應用方面看,首先是汽車市場,所有ADAS技術提供了一條通向自動駕駛的直接路線;第二是用于個人身份認證(解鎖、支付)的手機安全系統(tǒng);最后是生物特征識別及其在工業(yè)、監(jiān)控、安全、以及在智能建筑和智能家居中的應用。AI領域涌現(xiàn)出了大量的投資、收購和合作關系,而且在未來的幾年內市場規(guī)模將相當可觀,市場和收入都將快速增長。