應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

什么是機器學(xué)習(xí)?機器變得越來越聰明,不再是科幻電影

2020-11-11 09:29 BENCOM信息科技

導(dǎo)讀:機器學(xué)習(xí)(ML)是教導(dǎo)計算機系統(tǒng)根據(jù)一組數(shù)據(jù)進行預(yù)測的過程。通過為系統(tǒng)提供一系列的試驗和錯誤場景,機器學(xué)習(xí)研究人員致力于創(chuàng)建 可以分析數(shù)據(jù),回答問題并自行做出決定的人工智能系統(tǒng)。

機器學(xué)習(xí)(ML)是教導(dǎo)計算機系統(tǒng)根據(jù)一組數(shù)據(jù)進行預(yù)測的過程。通過為系統(tǒng)提供一系列的試驗和錯誤場景,機器學(xué)習(xí)研究人員致力于創(chuàng)建 可以分析數(shù)據(jù),回答問題并自行做出決定的人工智能系統(tǒng)。

機器學(xué)習(xí)通常使用基于測試數(shù)據(jù)的算法,該算法有助于在將來的決策中進行推理和模式識別,從而消除了對傳統(tǒng)計算機軟件要求的來自人類的明確指令的需求。

什么是機器學(xué)習(xí)?

機器學(xué)習(xí)依賴于大量數(shù)據(jù),這些數(shù)據(jù)被饋送到算法中,以生成一個模型,系統(tǒng)可以根據(jù)該模型來預(yù)測其未來的決策。例如,如果您要輸入到系統(tǒng)中的數(shù)據(jù)是一年中每天在午餐中吃的水果,則您可以使用預(yù)測算法來分析不同的水果,并為該水果建立預(yù)測模型您可能在第二年進食。

該過程基于反復(fù)試驗的情況,通常使用多種算法。這些算法分為線性模型,非線性模型,甚至神經(jīng)網(wǎng)絡(luò)。它們最終將取決于您正在使用的數(shù)據(jù)集以及您要回答的問題。

機器學(xué)習(xí)算法如何工作?

機器學(xué)習(xí)算法會隨著時間的推移使用數(shù)據(jù)來學(xué)習(xí)和改進,并且不需要人工指導(dǎo)。該算法分為三種類型:有監(jiān)督,無監(jiān)督和強化學(xué)習(xí)。每種學(xué)習(xí)類型都有不同的目的,并且可以使數(shù)據(jù)以不同的方式使用。

監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)涉及標(biāo)記的訓(xùn)練數(shù)據(jù),算法使用該訓(xùn)練數(shù)據(jù)來學(xué)習(xí)將輸入變量轉(zhuǎn)換為輸出變量以求解方程的映射函數(shù)。其中有兩種監(jiān)督學(xué)習(xí)類型:分類,當(dāng)輸出為類別形式時,用于預(yù)測給定樣本的結(jié)果;回歸,當(dāng)輸出時,用于預(yù)測給定樣本的結(jié)果。變量是實際值,例如“工資”或“權(quán)重”。

監(jiān)督學(xué)習(xí)模型的一個示例是K-最近鄰居(KNN)算法,它是一種模式識別方法。KNN本質(zhì)上涉及使用圖表來根據(jù)附近相似物體的傳播情況得出關(guān)于物體分類的有根據(jù)的猜測。

在上表中,綠色圓圈表示一個尚未分類的對象,它只能屬于兩個可能的類別之一:藍色正方形或紅色三角形。為了識別其所屬的類別,在這種情況下,算法將分析圖表上最接近的對象,算法將合理地假設(shè)綠色圓圈應(yīng)屬于紅色三角形類別。

無監(jiān)督學(xué)習(xí)

當(dāng)只有輸入變量而沒有相應(yīng)的輸出變量時,將使用無監(jiān)督學(xué)習(xí)模型。它使用未標(biāo)記的訓(xùn)練數(shù)據(jù)來建模數(shù)據(jù)的基礎(chǔ)結(jié)構(gòu)。

無監(jiān)督學(xué)習(xí)算法有三種類型:關(guān)聯(lián),廣泛用于市場購物分析;聚類,用于匹配與另一個聚類中的對象相似的樣本;和降維,用于減少數(shù)據(jù)集中變量的數(shù)量,同時保持其重要信息不變。

強化學(xué)習(xí)

強化學(xué)習(xí)允許代理通過學(xué)習(xí)最大化獎勵的行為,根據(jù)其當(dāng)前狀態(tài)決定其下一步行動。它通常用于游戲環(huán)境,在游戲環(huán)境中提供了規(guī)則的算法,并負(fù)責(zé)以最有效的方式解決挑戰(zhàn)。該模型最初會隨機開始,但是隨著時間的流逝,通過反復(fù)試驗,它將了解需要在游戲中移動的位置和時間以最大化得分。

在這種類型的培訓(xùn)中,獎勵僅僅是與積極成果相關(guān)的狀態(tài)。例如,如果算法能夠?qū)⑵嚤3衷诘缆飞隙粫驳秸系K物,那么它將“獎勵”任務(wù)完成。

為什么機器學(xué)習(xí)很有用?

本質(zhì)上,機器學(xué)習(xí)解決了數(shù)據(jù)過多的問題。人們,行動,事件,計算機和小工具所產(chǎn)生的信息太多,以至于人類幾乎不可能從中學(xué)習(xí)任何東西。在醫(yī)學(xué)分析中,要在成千上萬的MRI掃描中找到模式,一個人可能要花費數(shù)小時,數(shù)天或數(shù)周的時間才能完成,但是如果正確標(biāo)記了機器,機器可以吸收這些信息并在幾秒鐘內(nèi)發(fā)現(xiàn)這些模式。

機器學(xué)習(xí)在哪里使用?

我們每天都會使用最簡單,最成功的機器學(xué)習(xí)示例之一-Google搜索。搜索引擎由許多ML算法提供支持,這些算法可以讀取和分析您輸入的文本,并根據(jù)您的搜索歷史和在線習(xí)慣來定制結(jié)果。例如,如果您輸入“ Java”,您將獲得圍繞編程語言的結(jié)果,或者更頻繁地浮出水面,這取決于它決定了您的偏好。

我們未來的許多技術(shù)進步都取決于機器學(xué)習(xí)的發(fā)展,例如無人駕駛汽車和智慧城市。許多為智慧城市提供動力的系統(tǒng)正在進入公共空間,例如面部識別系統(tǒng),該系統(tǒng)中的機器學(xué)習(xí)算法被教為識別圖像中的模式并根據(jù)其特征識別對象。但是,這已被證明是ML的有爭議用途,尤其是因為它并不總是準(zhǔn)確的,并且經(jīng)常涉及對公民的某種定期監(jiān)視。

數(shù)據(jù)偏差

隨著機器學(xué)習(xí)的改進和更多技術(shù)的使用,人們越來越擔(dān)心將偏見嵌入關(guān)鍵的和面向公眾的軟件中。機器學(xué)習(xí)應(yīng)用程序依賴于數(shù)據(jù),而正是這些數(shù)據(jù)可能成為偏差的來源。例如,如果一家公司想雇用更多不同種類的人,但使用其當(dāng)前雇員的簡歷,則默認(rèn)情況下,其機器學(xué)習(xí)程序?qū)⒅粚ふ腋嘞嗤娜恕?/p>

正是這種類型的機器學(xué)習(xí)應(yīng)用引起了政府的擔(dān)憂,因此,許多政府正在采取強制性的法規(guī)來解決這個問題。英國數(shù)據(jù)倫理與創(chuàng)新中心(CDEI)宣布將與內(nèi)閣辦公室種族差異部門合作,調(diào)查算法決策中的潛在偏見。同樣,美國政府將試行AI方面的多樣性法規(guī),以降低計算機系統(tǒng)中性偏見和種族偏見的風(fēng)險。