導讀:世界科技飛速發(fā)展,視覺語言導航技術(shù)日臻成熟,高智商的機器人正向我們走來。
有專家這樣說,人類開發(fā)人工智能的未來目標,如同現(xiàn)在科幻電影所呈現(xiàn)的場景一樣,智能機器可以獨立“看、聽、思、行”,具備像人類一樣的語言理解系統(tǒng)、視覺感知系統(tǒng)、自我理解與行動的能力,最終成為人類的完美“替身”。
如今,世界科技飛速發(fā)展,視覺語言導航技術(shù)日臻成熟,高智商的機器人正向我們走來。
視覺語言導航,指的是讓智能體跟著自然語言指令進行導航,同時理解指令與視角中可以看見的圖像信息,然后在環(huán)境中對自身所處狀態(tài)加以調(diào)整、修復,做出對應的動作,最終到達目標位置。比如,我們把機器人放置在一間臥室里,讓它去取放在另一間臥室里的足球。因為房間無法通視,機器人需要走出房間,經(jīng)過走廊、客廳等場所,并通過推算看到的每一處環(huán)境信息,來判定下一步行進方向,最終定位找到足球。
由此可見,視覺語言導航涉及計算機視覺、自然語言處理和自主學習三大核心技術(shù)。
先進的科技成果往往備受軍事領域的青睞。世界許多國家已開始致力于視覺語言導航在人工智能上的拓展運用,打造智能戰(zhàn)爭機器,搶占打贏明天戰(zhàn)爭的前沿高地。
計算機視覺,讓智能機器“看清”世界
計算機視覺是一個跨領域的交叉學科,包括計算機科學、數(shù)學、工程學、物理學、生物學和心理學等。
在人工智能里,計算機視覺可以類比人類的眼睛,是在感知層上最為重要的核心技術(shù)之一。它能讓智能機器人靈敏地辨識“眼”前的一切,并對捕捉到的圖像數(shù)據(jù)信息進行分析識別、檢測、跟蹤等。嵌入計算機視覺技術(shù)的智能武器,可以通過視覺系統(tǒng),精準辨識和區(qū)分目標的主次、真?zhèn)?,大大提升作?zhàn)效率。
據(jù)悉,現(xiàn)在技術(shù)人員讀取由無人機傳回的戰(zhàn)場態(tài)勢數(shù)據(jù),每天的工作時間要超過10個小時。這與瞬息萬變的未來戰(zhàn)場不相適應。然而,當計算機視覺技術(shù)應用于戰(zhàn)場智能偵察裝備前端時,可從海量信息中有效過濾無關(guān)信息,向作戰(zhàn)人員提供甄別處理后的視覺態(tài)勢圖,指揮決策效率隨之提升。
當前,世界發(fā)達國家的部分裝備已經(jīng)開始應用該項技術(shù)。如美軍搭載計算機視覺技術(shù)的iRobot偵察機器人,就是其中之一。它可以警告作戰(zhàn)人員有伏擊或其他危險,經(jīng)過處理的態(tài)勢感知,能夠明確指出目標坐標,或提示危險等級。該偵察機器人還可準確傳回有價值的態(tài)勢視頻與相關(guān)建議指令,縮短己方在戰(zhàn)場上的決策周期,從而把握行動優(yōu)勢。
近年來,俄軍也在大力開發(fā)人工智能系統(tǒng)。其自主研制的陸戰(zhàn)機器人,可在遙控下完成巡邏、偵察、追蹤、阻截、攻擊等任務;形似軍犬、快速奔跑的機器人,可供火線運輸彈藥給養(yǎng);鏟車式機器人,可將戰(zhàn)場上的傷員用鏟斗送回后方等。俄軍部分導彈也已裝有人工智能設備,在導彈飛向預定目標時,若人工智能設備在途中甄別出價值更大的目標,導彈可自動轉(zhuǎn)向進行攻擊。在這些先進的武器中,都能看到計算機視覺的影子。
在民用領域,計算機視覺技術(shù)已陸續(xù)應用到安防、自動駕駛、醫(yī)療、消費等活動中。這也是當前人工智能細分領域中發(fā)展最快、應用最廣、炙手可熱的技術(shù)之一。
隨著算法的更迭、硬件算力的升級、數(shù)據(jù)的大爆發(fā),以及5G帶來的高速網(wǎng)絡,無論在民用領域還是軍用領域,計算機視覺技術(shù)的應用將會有更大的空間。
自然語言處理,讓智能機器“聽懂”指令
簡單地說,自然語言處理就是用計算機來處理、理解以及運用人類語言(如中文、英文等),它屬于人工智能的一個分支,是計算機科學與語言學的交叉學科,又常被稱為計算語言學。
自然語言處理的歷史發(fā)展大致經(jīng)歷了3個階段:20世紀40年代到20世紀50年代屬于萌芽期,英國科學家艾倫·麥席森·圖靈的計算機算法模型為現(xiàn)代計算機科學奠定了基礎;20世紀60年代到20世紀80年代屬于發(fā)展期,機器翻譯技術(shù)日漸成熟,并被應用于實際生活;20世紀90年代后屬于繁盛期,隨著計算機計算量、計算速度以及萬維網(wǎng)的爆炸式發(fā)展,自然語言處理技術(shù)也隨之在更多方面得到長足進步。
眾所周知,語言是人類區(qū)別于其他動物的根本標志之一,沒有語言,人類的思維也就無從談起。所以,自然語言處理技術(shù)體現(xiàn)了人工智能的最高任務與境界。也就是說,只有當智能機器具備了處理自然語言的能力,才算實現(xiàn)了真正的智能。這樣,人類才能與機器人進行無障礙語言溝通。
如今,自然語言處理在軍事上的應用越來越多。比如,在指揮控制上,通過高辨識度的語音系統(tǒng),指揮員可以在作戰(zhàn)中直接用語音實時控制雷達、無線電、火力等作戰(zhàn)單元,省去繁瑣的指揮流程,集中精力專注于作戰(zhàn)謀劃;在通信保障上,語音增強技術(shù)能夠減弱噪聲對智能機器語音信號的干擾,減少聽話人的疲勞和溝通失誤;在人機交互上,典型代表是人機口語對話系統(tǒng),人類通過自然口語與復雜的智能機器系統(tǒng)進行交互,包括語音識別、語言理解、語言生成、語音合成、對話管理和知識庫等。
提起“臺風”戰(zhàn)斗機,相信軍迷們都不會陌生。它是由英國、德國、西班牙、意大利聯(lián)合研發(fā)的,最大的技術(shù)亮點是搭載了直接語音輸入系統(tǒng),飛行員可以通過語音下達命令,控制戰(zhàn)機的傳感器、武器以及自衛(wèi)系統(tǒng)。
除此之外,自然語言處理在不少國家的醫(yī)學、互聯(lián)網(wǎng)監(jiān)控、執(zhí)法部門的犯罪預防以及大數(shù)據(jù)反恐應用等領域也很受歡迎,極大地提升了任務執(zhí)行效率。
自主學習,讓智能機器“蛻變”成長
嬰兒剛出生時,只會用眼神、哭泣、歡笑與周圍的人交流。隨著一天天長大,他們不斷擴大接觸觀察范圍,學會了走路、說話、做游戲等,慢慢建立起自己的思維體系。這就是人類的一個自我學習成長過程。人類大腦擁有860億個神經(jīng)元、數(shù)萬億個傳遞信息的結(jié)構(gòu)——神經(jīng)突觸。神經(jīng)突觸的重要特征是具有可塑性,即允許神經(jīng)元對記憶進行編碼、學習和自我修復。
人工智能的自主學習技術(shù),就是讓機器人像擁有人類大腦、甚至超越人類大腦一樣,可以通過思考學習實現(xiàn)自我完善。在很多人眼里,自主學習能力是人工智能與人類智能的天然鴻溝。當前,伴隨該項技術(shù)的發(fā)展,這一鴻溝正在被逐漸填平。
2019年11月,在捷克布拉格召開的第二屆計算機視覺與模式識別國際會議上,評分第一的論文主要貢獻就是為智能機器提供了自主學習反饋機制,讓其自主導航時能夠?qū)崟r詢問自己的知識儲備。
“這條路對嗎?”“到目的地了嗎?”……擁有學習反饋機制的智能機器,根據(jù)預設環(huán)境信息與實際對比,在行動過程中形成“是非”觀念,讓智能機器真正變成有思想的“機器人”。
究其根本,智能機器“是非觀”的形成,離不開強化學習,這種學習方式是當今人工智能最熱門的研究領域之一。
說到這里,我們不能不提無師自通的“圍棋高手”阿爾法元(AlphaGo Zero),它的一鳴驚人也正是利用了新的強化學習方式。從一個對圍棋“零”儲備的神經(jīng)網(wǎng)絡開始,接著與強大的搜索算法相結(jié)合,神經(jīng)網(wǎng)絡在博弈中不斷被調(diào)整更新后,與搜索算法再次重新組合,循環(huán)往復,系統(tǒng)性能經(jīng)過每一次迭代持續(xù)提高,使得神經(jīng)網(wǎng)絡預測越來越精準,阿爾法元也擁有了“戰(zhàn)無不勝”的本領。可以說,它也讓人工智能離“像人類一樣”更近了一步。
如果把自主學習技術(shù)應用于軍事無人裝備上,并按照戰(zhàn)斗力水平劃分等級,那么自主學習級和智能對抗級應該屬于“王者”級別。自主學習級,就是不再局限于人為提供的學習樣本,可以邊執(zhí)行任務邊組織學習,并且遇強更強,靈活應對任務過程中出現(xiàn)的未知事件;智能對抗級,是指無人裝備在具備自主學習智能水平的基礎上,形成自身的核心價值,能夠短時間內(nèi)適應未知的任務環(huán)境,迅速理解周圍局勢并做出判斷,完成作戰(zhàn)任務。
從近幾年的技術(shù)突破來看,智能機器感知環(huán)境、識別語言、自主學習的能力越來越強大。這些能力的提升,不僅使智能機器成為人類分擔任務的得力幫手,也或?qū)⒆屗蔀槲磥響?zhàn)場的主角。