技術(shù)
導(dǎo)讀:大數(shù)據(jù)和人工智能技術(shù)總是結(jié)合在一起是很自然的,但是在這一過(guò)程中,人們對(duì)人工智能和大數(shù)據(jù)如何協(xié)同工作產(chǎn)生了一些誤解,導(dǎo)致潛在的混亂,IT領(lǐng)導(dǎo)者應(yīng)在采用數(shù)據(jù)驅(qū)動(dòng)型策略時(shí)進(jìn)行澄清。
隨著越來(lái)越多的組織采用大數(shù)據(jù)技術(shù)處理大量、快速、多變的信息資產(chǎn),通常很快就會(huì)面臨如何從中有效地獲得洞察力和商業(yè)價(jià)值的問(wèn)題。
Talend公司產(chǎn)品高級(jí)總監(jiān)Jean-Michel Franco為此表示,“大數(shù)據(jù)技術(shù)自然可以帶來(lái)高級(jí)分析措施。但當(dāng)組織可以捕獲有關(guān)可以改進(jìn)業(yè)務(wù)主題的大量信息時(shí),不要只是了解事物表面,還想發(fā)現(xiàn)事物本質(zhì),找出根本原因,預(yù)測(cè)將要發(fā)生的事情,并準(zhǔn)確地解決問(wèn)題。而人類在沒(méi)有機(jī)器幫助的情況下獨(dú)自完成是很難做到的?!倍斯ぶ悄芗夹g(shù)已經(jīng)成為一種理解所有信息的方式,并且實(shí)際上成為一種需要大量數(shù)據(jù)才能實(shí)施的學(xué)科。
因此,大數(shù)據(jù)和人工智能技術(shù)總是結(jié)合在一起是很自然的。商業(yè)轉(zhuǎn)型和外包咨詢服務(wù)商PaceHarmon公司總監(jiān)JP Baritugo說(shuō):“大數(shù)據(jù)和人工智能之間存在著牢固的關(guān)系。大數(shù)據(jù)是燃料,人工智能是手段。”
但是在這一過(guò)程中,人們對(duì)人工智能和大數(shù)據(jù)如何協(xié)同工作產(chǎn)生了一些誤解,導(dǎo)致潛在的混亂,IT領(lǐng)導(dǎo)者應(yīng)在采用數(shù)據(jù)驅(qū)動(dòng)型策略時(shí)進(jìn)行澄清:
1. 某些類型的人工智能可能不需要大數(shù)據(jù)
例如,一些聊天機(jī)器人學(xué)習(xí)的輸入數(shù)據(jù)集可能比人工智能技術(shù)還要少。
Baritugo說(shuō),“‘垃圾輸入,垃圾輸出’的數(shù)據(jù)分析理念是適用的,因?yàn)榻M織需要足夠的良好數(shù)據(jù)來(lái)從其人工智能工作中驅(qū)動(dòng)具有意義的價(jià)值。但需要多少數(shù)據(jù)可能會(huì)有所不同。”
Everest集團(tuán)執(zhí)行副總裁兼資深分析師Sarah Burnett為此解釋說(shuō):“大數(shù)據(jù)意味著由結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)組成的大數(shù)據(jù)集,可以為人工智能的一些應(yīng)用提供數(shù)據(jù),例如需要大量數(shù)據(jù)來(lái)訓(xùn)練人工智能、分析信息以發(fā)現(xiàn)模式,并用概率來(lái)提出問(wèn)題的答案時(shí),并非所有人工智能都需要大量數(shù)據(jù)?!?/p>
Baritugo 說(shuō),“通過(guò)設(shè)計(jì),人工智能通常需要大型的規(guī)范化數(shù)據(jù)集(即大數(shù)據(jù)的“清理”子集)來(lái)有意義地識(shí)別模式并生成必要的輸出,其所需的數(shù)據(jù)量(包括培訓(xùn)和評(píng)估數(shù)據(jù)集)主要由問(wèn)題的復(fù)雜性、需要評(píng)估的輸入功能的數(shù)量以及所使用的算法決定。”
例如,機(jī)器學(xué)習(xí)(ML)通常需要比深度學(xué)習(xí)(機(jī)器學(xué)習(xí)的另一個(gè)子集)更少的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練。
2. 并非所有大數(shù)據(jù)都需要人工智能的應(yīng)用
人工智能可能有助于推動(dòng)數(shù)據(jù)分析,但不一定需要從大數(shù)據(jù)中提取價(jià)值。ISG公司認(rèn)知自動(dòng)化和創(chuàng)新總監(jiān)Wayne Butterfield說(shuō),“高級(jí)分析已成為大多數(shù)組織多年來(lái)利用的概念。這實(shí)際上取決于數(shù)據(jù)集的大小和需要分析的不同數(shù)據(jù)集的數(shù)量。就算專家擁有最聰明的頭腦,也不可能在有限的時(shí)間內(nèi)在一些大型數(shù)據(jù)集中找到具有洞察力的模式,因此機(jī)器學(xué)習(xí)在完成繁重工作方面具有一定優(yōu)勢(shì),但是并非所有數(shù)據(jù)集都是龐大而多樣的,因此不一定總是需要采用機(jī)器學(xué)習(xí)(ML)才能從中獲得洞察力?!?/p>
IT組織還可以使用商業(yè)智能、分析和數(shù)據(jù)倉(cāng)庫(kù)解決方案來(lái)分析數(shù)據(jù)并可視化見(jiàn)解。
3. 高級(jí)分析和人工智能并不一樣
很多時(shí)候,人們使用“大數(shù)據(jù)”一詞來(lái)更廣泛地描述這些信息資產(chǎn)的高級(jí)分析,這并沒(méi)有什么問(wèn)題。但是他們可能認(rèn)為高級(jí)分析和人工智能也是可以互換的術(shù)語(yǔ),這種想法是不對(duì)的。
Burnett說(shuō):“人工智能和高級(jí)分析緊密聯(lián)系在一起,但存在一些關(guān)鍵區(qū)別。例如,人工智能可以嘗試各種假設(shè)、自我學(xué)習(xí)并增強(qiáng)其分析。盡管人工智能技術(shù)可以分析數(shù)據(jù),卻無(wú)法自我學(xué)習(xí),只能依靠人類來(lái)設(shè)置其參數(shù)?!?/p>
4. 大數(shù)據(jù)可能會(huì)扭曲人工智能模型
Franco說(shuō),“大數(shù)據(jù)為人工智能和機(jī)器學(xué)習(xí)奠定了基礎(chǔ)。獲得的數(shù)據(jù)越多,模型就越好。但是當(dāng)數(shù)據(jù)不受控制時(shí),也會(huì)給人工智能和機(jī)器學(xué)習(xí)帶來(lái)偏差?!?/p>
過(guò)分關(guān)注數(shù)據(jù)的數(shù)量而不是質(zhì)量往往是罪魁禍?zhǔn)?。Franco說(shuō):“當(dāng)人們無(wú)法控制基礎(chǔ)數(shù)據(jù)時(shí),人工智能和機(jī)器學(xué)習(xí)不可避免地會(huì)遭遇失敗。將大量數(shù)據(jù)收集到數(shù)據(jù)湖中并不能為人工智能和機(jī)器學(xué)習(xí)的成功奠定足夠的基礎(chǔ)?!?/p>
5. 組織可能已經(jīng)將人工智能和大數(shù)據(jù)結(jié)合在一起但卻不知情
Burnett談到智能文檔處理(IDP)軟件時(shí)說(shuō):“有些軟件解決方案已經(jīng)內(nèi)置了人工智能功能,可以隨時(shí)安裝、訓(xùn)練和使用。這些解決方案加速了人工智能的采用,并幫助組織處理特定的業(yè)務(wù)需求。在這些情況下,不一定需要了解人工智能技術(shù)才能獲得收益。”
6. 人類證明了將大數(shù)據(jù)和人工智能結(jié)合起來(lái)的必要性
當(dāng)涉及大數(shù)據(jù)和人工智能時(shí),信任和透明度是關(guān)鍵。Franco說(shuō),“組織需要扎實(shí)的數(shù)據(jù)基礎(chǔ),才能使用人工智能獲得正確的見(jiàn)解。而且,組織員工需要參與到數(shù)據(jù)治理的過(guò)程,以控制數(shù)據(jù)(數(shù)據(jù)質(zhì)量、代表性、數(shù)據(jù)隱私)和算法(使用可解釋的人工智能能夠理解算法的內(nèi)容)?!?/p>
7. 并非所有數(shù)據(jù)都對(duì)人工智能有用
Butterfield說(shuō):“與人工智能結(jié)合使用時(shí),通常在擁有大量數(shù)據(jù)和擁有正確數(shù)據(jù)以提供見(jiàn)解之間有著很好的平衡。人工智能并不是解決所有問(wèn)題的靈丹妙藥,至少到目前為止是這樣。企業(yè)領(lǐng)導(dǎo)者需要意識(shí)到這一點(diǎn)?!?/p>