歐盟人工智能高級別專家組(AI HLEG)近日發(fā)布《人工智能定義:主要能力和科學(xué)學(xué)科》,簡要描述了高級專家組對其交付的成果中所使用的對該學(xué)科的共同理解。文件主要從AI系統(tǒng)的能力和學(xué)科角度出發(fā),厘清并擴(kuò)展了其中的部分概念,并且闡述了AI的其他重要概念和問題,繼而更新了人工智能的定義。 歐盟委員會《人工智能通訊》的相關(guān)定義為“顯示‘智能行為’的系統(tǒng)——通過分析環(huán)境并在一定程度上自主執(zhí)行任務(wù)。基于AI的系統(tǒng)可以是虛擬世界中運(yùn)行的純軟件,如語音助手、圖像分析軟件、搜索引擎、語音和人臉識別系統(tǒng)等,也可以嵌入硬件設(shè)備,如先進(jìn)機(jī)器人、自動駕駛汽車、無人機(jī)或物聯(lián)網(wǎng)應(yīng)用等?!?/p> 在本文中,AI HLEG擴(kuò)展了上述定義,從科學(xué)學(xué)科和技術(shù)兩個(gè)層面來厘清人工智能概念,力求避免誤解,希望成為非AI專家也能有效掌握的人工智能共識,并為將來討論AI倫理準(zhǔn)則和AI政策建議提供有利的支撐。 一、AI系統(tǒng)術(shù)語AI顯然包含智能概念,但在機(jī)器智能和人類智能中,智能的定義含糊——即便心理學(xué)家、生物學(xué)家和神經(jīng)科學(xué)家已對其進(jìn)行了長期研究,故而AI研究人員更習(xí)慣使用“理性”這一概念。“理性”是指在給定優(yōu)化條件和可用資源的情況下,為實(shí)現(xiàn)某個(gè)目標(biāo)而選擇最優(yōu)行為的能力。當(dāng)然,理性雖不是智能概念的唯一要素,但也是其中的重要組成部分。 在下文中,我們將使用術(shù)語“AI系統(tǒng)”來表示任何基于AI的組件、軟件或硬件。更常見的是,AI系統(tǒng)是作為組件嵌入到較大系統(tǒng)中,而不是作為獨(dú)立系統(tǒng)。 人工智能學(xué)科最常用的教科書《人工智能:一種現(xiàn)代的方法》中指出,AI系統(tǒng)首要的是理性。但AI系統(tǒng)如何實(shí)現(xiàn)理性?正如上述關(guān)于AI定義的第一句所述,它通過以下方式實(shí)現(xiàn)(詳見圖1):通過傳感器感知系統(tǒng)所處的周遭環(huán)境,收集并解讀數(shù)據(jù),推理被感知的內(nèi)容或處理從數(shù)據(jù)中獲取的信息,決定最優(yōu)行為,再通過執(zhí)行器采取相應(yīng)行動,從而可能改變環(huán)境。AI系統(tǒng)可以使用符號規(guī)則或?qū)W習(xí)數(shù)字模型,也可以通過分析先前操作對環(huán)境的影響來調(diào)整其行為。 圖1:AI系統(tǒng)的示意圖 傳感器和感知:在圖1中,系統(tǒng)的傳感器使用wifi符號來表示,在實(shí)踐中,它們可以是攝像頭、麥克風(fēng)、鍵盤、網(wǎng)站或其他輸入設(shè)備,也可以是物理量的傳感器(例如溫度、壓力、距離、力/扭矩、觸覺傳感器等)。通常,我們需要為AI系統(tǒng)提供足夠的傳感器,使其能充分感知目標(biāo)環(huán)境的數(shù)據(jù)(與人類設(shè)計(jì)人員給予AI系統(tǒng)的目標(biāo)相關(guān))。例如,如果我們要設(shè)計(jì)一個(gè)AI系統(tǒng),實(shí)現(xiàn)在房間地板變臟時(shí)自動打掃,傳感器就包括可用來拍攝地板照片的攝像頭。 在收集數(shù)據(jù)方面,區(qū)分結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)很有必要。結(jié)構(gòu)化數(shù)據(jù)是指根據(jù)預(yù)定義模型(如關(guān)系數(shù)據(jù)庫)處理的數(shù)據(jù),而非結(jié)構(gòu)化數(shù)據(jù)不具有已知組織形式(如圖像或文本)。 推理/信息處理和決策:AI系統(tǒng)的核心是其推理/信息處理模塊,該模塊將來自傳感器的數(shù)據(jù)作為輸入,并根據(jù)實(shí)現(xiàn)目標(biāo)決定要采取的行動,這意味著傳感器收集的數(shù)據(jù)就需要轉(zhuǎn)換為推理/信息處理模塊可以理解的信息。在上述清掃地板的例子中,攝像頭將為推理/信息處理模塊提供地板圖片,該模塊需要決定是否清潔地板(即何為達(dá)到預(yù)期目標(biāo)的最優(yōu)行為)。雖然人類很容易從地板圖片中做出是否需要清掃的決定,但對于機(jī)器來說這并不容易,因?yàn)閳D片只是0和1的序列。因此,推理/信息處理模塊必須: 1、解讀圖片以確定地板是否干凈。一般而言,這意味著將數(shù)據(jù)轉(zhuǎn)換為信息并以簡潔的方式對信息建模,模型應(yīng)包括所有相關(guān)的數(shù)據(jù)(在這種情況下,即為地板是否干凈)。 2、對信息進(jìn)行推理或處理,生成數(shù)字模型(即數(shù)學(xué)公式),以便確定最優(yōu)行為。在上述例子中,如果從圖片中得到的信息是地板是臟的,最優(yōu)行為是進(jìn)行清掃,否則應(yīng)該保持靜止。 請注意,應(yīng)該更寬泛地看待“決策”一詞,選擇采取行動并不一定意味著AI系統(tǒng)是完全自主的。決策也可以是選擇某一建議推薦給人類,而人類作為最終決策者。 行動:一旦確定了行為,AI系統(tǒng)就可以通過可用的執(zhí)行器完成。在圖1中,執(zhí)行器使用機(jī)械臂圖標(biāo)來表示,但它們不一定是實(shí)物,也可以是軟件。在清掃的例子中,如果行為是清潔地板,AI系統(tǒng)可以發(fā)出激活吸塵器的信號。再舉個(gè)例子,會話系統(tǒng)(即聊天機(jī)器人)的行為是通過生成文本來響應(yīng)用戶表達(dá)。 行動可能改變環(huán)境,因此下次系統(tǒng)需要再次使用其傳感器,從改變后的環(huán)境中感知不同信息。 理性AI系統(tǒng)并不總是為其目標(biāo)選擇最優(yōu)行為,因此僅能實(shí)現(xiàn)有限理性,這是由于時(shí)間或計(jì)算能力等資源的限制所導(dǎo)致。 理性AI系統(tǒng)是AI系統(tǒng)的初級版本,它們能改變環(huán)境,但并不會隨著時(shí)間的推移調(diào)整行為以更好地實(shí)現(xiàn)目標(biāo)。學(xué)習(xí)型理性系統(tǒng)能夠在采取行動后,(通過感知)評估環(huán)境的新狀態(tài),以確定其行動是否有效,然后調(diào)整其推理規(guī)則和決策方法。 二、AI作為一門科學(xué)學(xué)科前文是關(guān)于AI系統(tǒng)非常簡單的抽象描述,主要通過AI的三個(gè)能力:感知、推理/決策和行動。但是,這足以讓我們介紹和理解目前用于構(gòu)建AI系統(tǒng)的大多數(shù)AI技術(shù)和子領(lǐng)域,因?yàn)樗鼈兌忌婕跋到y(tǒng)的這些能力。從廣義上講,所有這些技術(shù)都可以分為兩組,即推理和學(xué)習(xí)的能力,機(jī)器人則是另一個(gè)非常相關(guān)的學(xué)科。 推理與決策:這組技術(shù)包括知識表達(dá)和推理、計(jì)劃、調(diào)度、搜索和優(yōu)化。這組技術(shù)對來自傳感器的數(shù)據(jù)進(jìn)行推理。為了能夠做到這一點(diǎn),人們需要將數(shù)據(jù)轉(zhuǎn)換為知識,因此AI的領(lǐng)域之一是和如何最好地對知識建模(知識表達(dá))有關(guān)。知識建模后,下一步就是用它來推理(知識推理),包括通過符號規(guī)則、計(jì)劃和調(diào)度活動、搜索大型解決方案集、以及優(yōu)化問題的所有可能解決方案,最后一步是決定采取何種行動。AI系統(tǒng)的推理/決策部分通常非常復(fù)雜,需要組合上述多種技術(shù)。 學(xué)習(xí):這組技術(shù)包括機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、決策樹和許多其他學(xué)習(xí)技術(shù)。這組技術(shù)使AI系統(tǒng)學(xué)習(xí)如何解決無法精確定義的問題,或者解決方法無法采用符號推理規(guī)則來描述的問題。這類問題的例子通常與感知能力有關(guān),例如語言理解、計(jì)算機(jī)視覺或行為預(yù)測等,值得注意的是這些問題看上去很容易,因?yàn)樗鼈儗θ祟悂碚f確實(shí)很容易。然而,對于AI系統(tǒng)而言并非如此,因?yàn)樗鼈儾荒芤蕾嚦WR推理(至少目前還沒有),并且在系統(tǒng)需要解讀非結(jié)構(gòu)化數(shù)據(jù)時(shí)尤其困難。這時(shí)遵循機(jī)器學(xué)習(xí)方法的技術(shù)便派上用場。不過,機(jī)器學(xué)習(xí)技術(shù)不止用于感知,還能產(chǎn)生根據(jù)數(shù)據(jù)計(jì)算決策的數(shù)值模型(即數(shù)學(xué)公式)。 機(jī)器學(xué)習(xí)有幾種分支,使用最多的分別是監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。 在有監(jiān)督的機(jī)器學(xué)習(xí)中,人們不是向系統(tǒng)提供行為規(guī)則,而是提供輸入—輸出行為的示例,希望它能夠從示例中進(jìn)行概括(示例通常代表過去),并在示例并未出現(xiàn)過的情況下也能表現(xiàn)良好(可能是將來遇到的情況)。在我們的運(yùn)行示例中,我們將為系統(tǒng)投喂許多地板圖片和相應(yīng)的解釋(即該圖片中的地板是否干凈)。如果我們給出足夠多的例子,并且這些例子在大多數(shù)情況下都是多樣的和包容性的,那么系統(tǒng)將通過其機(jī)器學(xué)習(xí)算法進(jìn)行概括,了解如何正確解讀從未見過的圖像。一些機(jī)器學(xué)習(xí)方法采用基于神經(jīng)網(wǎng)絡(luò)概念的算法,神經(jīng)網(wǎng)絡(luò)受人類大腦的啟發(fā),它有一個(gè)處理單元構(gòu)成的網(wǎng)絡(luò)(類似于我們的神經(jīng)元),處理單元之間有很多加權(quán)連接。神經(jīng)網(wǎng)絡(luò)輸入的是來自傳感器的數(shù)據(jù)(地板的圖片),輸出的是對圖片的解讀(地板是否清潔)。在對示例的分析(網(wǎng)絡(luò)的訓(xùn)練階段)期間,調(diào)整連接的權(quán)重以盡可能地匹配可用示例的內(nèi)容(即最小化預(yù)期輸出與網(wǎng)絡(luò)計(jì)算輸出之間的誤差)。在訓(xùn)練階段結(jié)束時(shí),用全新的示例對神經(jīng)網(wǎng)絡(luò)行為進(jìn)行測試,檢查任務(wù)是否被習(xí)得。 值得注意的是這種方法(以及所有機(jī)器學(xué)習(xí)技術(shù))總是有一定比例的誤差,盡管誤差通常很小。因此,一個(gè)基本概念是“準(zhǔn)確率”(accuracy)——度量正確答案占據(jù)的百分比。 現(xiàn)有幾種神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)方法中,其中最成功是深度學(xué)習(xí)(deep learning)。深度學(xué)習(xí)指神經(jīng)網(wǎng)絡(luò)在輸入和輸出之間具有若干層,可以通過連續(xù)步驟學(xué)習(xí)輸入—輸出的整體關(guān)系,這使得整體方法更加準(zhǔn)確,并且不需要人工指導(dǎo)。 神經(jīng)網(wǎng)絡(luò)只是一種機(jī)器學(xué)習(xí)工具,還有許多其它具有不同屬性的工具:隨機(jī)森林(random forests)及提升樹(boosted trees)、聚類方法(clustering methods)、矩陣分解(matrix factorization)等。 另一種有用的機(jī)器學(xué)習(xí)方法稱為強(qiáng)化學(xué)習(xí)(reinforcement learning)。在這種方法中,我們讓AI系統(tǒng)自由地做出決定,并且針對每個(gè)決策回饋一個(gè)獎勵信號,告訴AI系統(tǒng)決策的好壞。隨著時(shí)間的推移,該系統(tǒng)的目標(biāo)是最大化所獲得的積極獎勵。該方法用于推薦系統(tǒng)(例如部分向用戶推薦潛在購買選擇的在線推薦系統(tǒng)),也應(yīng)用于營銷。 機(jī)器學(xué)習(xí)方法不僅適用于感知任務(wù),例如視覺和文本理解,而且適用于所有那些難以定義且無法通過符號行為規(guī)則全面描述的任務(wù)。 用于處理無法以符號方式描述的新任務(wù)的機(jī)器學(xué)習(xí)方法,以及隨著時(shí)間的推移調(diào)整其行為以更好地實(shí)現(xiàn)給定目標(biāo)的學(xué)習(xí)型理性代理(上文提及),需要注意兩者的區(qū)別。這兩種技術(shù)可以重疊或互補(bǔ),但不一定相同。 機(jī)器人:機(jī)器人技術(shù)可以被定義為“物理世界中行動的AI”(也稱為具身AI,embodied AI)。機(jī)器人是一種實(shí)物機(jī)器,應(yīng)對物理世界的動態(tài)、不確定性和復(fù)雜性。感知、推理、行動、學(xué)習(xí)以及與其他系統(tǒng)的交互能力通常集成在機(jī)器人系統(tǒng)的控制架構(gòu)中。除人工智能外,其他學(xué)科還在機(jī)器人設(shè)計(jì)和操作中發(fā)揮作用,如機(jī)械工程和控制理論。機(jī)器人包括機(jī)械臂、自動駕駛車輛(例如汽車、無人機(jī)、飛行出租車)、類人機(jī)器人、機(jī)器人真空吸塵器等。 圖2描繪了上述大多數(shù)AI子學(xué)科以及它們的關(guān)系。然而,需要注意的是AI比這張圖片要復(fù)雜得多,因?yàn)樗S多其他子學(xué)科和技術(shù)。此外,如上所述,機(jī)器人技術(shù)還依賴于AI領(lǐng)域之外的技術(shù)。但是,我們相信這對于在多學(xué)科和由多元利益相關(guān)方構(gòu)成的高級別專家組內(nèi)進(jìn)行對AI技術(shù)、AI道德和AI政策的分享和理解并討論已經(jīng)足夠。 圖2:AI的子學(xué)科及其關(guān)系的簡要概述(注:機(jī)器學(xué)習(xí)和推理都包括許多其他技術(shù),機(jī)器人技術(shù)包括AI領(lǐng)域之外的技術(shù)。AI整體屬于計(jì)算機(jī)科學(xué)學(xué)科) 三、AI的其他重要概念和問題狹義人工智能(弱智能)和通用人工智能(強(qiáng)智能):通用人工智能系統(tǒng)指能夠執(zhí)行人類可執(zhí)行的大多數(shù)活動的系統(tǒng),而狹義AI系統(tǒng)是可以執(zhí)行一個(gè)或幾個(gè)特定任務(wù)的系統(tǒng)。目前部署的AI系統(tǒng)是狹義AI。在人工智能早期,研究人員使用了不同的術(shù)語(弱AI和強(qiáng)AI)。要實(shí)現(xiàn)通用AI所需的能力,仍然存在許多開放的倫理、科學(xué)和技術(shù)挑戰(zhàn),例如常識推理,自我意識以及機(jī)器來定義其自身目標(biāo)的能力。 數(shù)據(jù)問題與偏見:由于多數(shù)AI系統(tǒng)(例如包括監(jiān)督機(jī)器學(xué)習(xí)組件的系統(tǒng))的良好表現(xiàn)實(shí)際依賴于大量數(shù)據(jù),因此了解數(shù)據(jù)如何影響AI系統(tǒng)的行為非常重要。例如,如果訓(xùn)練數(shù)據(jù)存在偏見,即不夠平衡或不夠包容,那么基于這些數(shù)據(jù)進(jìn)行培訓(xùn)的人工智能系統(tǒng)將無法對數(shù)據(jù)進(jìn)行很好概括,并且可能做出不利于特定群體而惠及其他群體的不公平?jīng)Q策。最近,AI社群一直在研究方法來檢測和減輕在訓(xùn)練數(shù)據(jù)集及AI系統(tǒng)其他部分的偏見的情況。 AI黑箱與可解釋性:即便部分機(jī)器學(xué)習(xí)技術(shù)從準(zhǔn)確率的角度來看非常成功,但在其如何做出決策方面卻非常不透明。而AI黑箱的概念描述的便是這樣的場景,其形成決策的原因無法被追溯??山忉屝裕╡xplainability)指人工智能系統(tǒng)可以為其行為提供解釋。 目標(biāo)導(dǎo)向的AI:當(dāng)前的AI系統(tǒng)是目標(biāo)導(dǎo)向的,這意味著它們從人類那里接收了需要實(shí)現(xiàn)的具體目標(biāo)并使用技術(shù)來加以實(shí)現(xiàn),它們無法自我定義目標(biāo),但有些AI系統(tǒng)(例如基于某種機(jī)器學(xué)習(xí)技術(shù)的系統(tǒng))可以更自由地決定采用何種路徑實(shí)現(xiàn)給定目標(biāo)。 四、更新的AI定義我們建議使用如下AI定義,并將此文檔作為支撐此定義的附加信息來源: “人工智能(AI)系統(tǒng)是由人類直接設(shè)計(jì)或借助AI技術(shù)優(yōu)化設(shè)計(jì)的軟硬件系統(tǒng),在給定復(fù)雜目標(biāo)的情況下,從物理或數(shù)字維度,通過數(shù)據(jù)獲取來感知環(huán)境,解讀所收集的結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),基于知識進(jìn)行推理,或者通過處理來自數(shù)據(jù)的信息,為實(shí)現(xiàn)給定目標(biāo)決定采取的一個(gè)或多個(gè)最優(yōu)行動。AI系統(tǒng)可以是使用符號規(guī)則或者通過數(shù)字模型來學(xué)習(xí),也可以通過分析環(huán)境受先前操作的影響來調(diào)整其行為。 作為一門科學(xué)學(xué)科,人工智能包括多種方法和技術(shù),如機(jī)器學(xué)習(xí)(其中深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)是具體的例子)、機(jī)器推理(包括計(jì)劃、調(diào)度、知識表達(dá)和推理、搜索和優(yōu)化)和機(jī)器人技術(shù)(包括控制、感知、傳感器和執(zhí)行器、以及與所有其他信息物理系統(tǒng)技術(shù)的集成)?!?/p> |
|