編者按: 谷歌的人工智能機器AlphaGo三次將韓國圍棋九段高手李世石挑落馬下,五番棋勝負已分。然而,在人們已經(jīng)為人工智能在圍棋上的勝利歡呼時,復旦大學計算機學院教授危輝認為,我們應該保持審慎樂觀,因為人工智能的核心科學難題,從50年多前人工智能的誕生到現(xiàn)在,還一個都沒解決,以前人工智能做不了的事情現(xiàn)在仍幾乎不能做,進步之處在于現(xiàn)在計算機的計算速度快了許多。本文來自上??茀f(xié)大講壇暨第201期新民科學咖啡館危輝教授講座現(xiàn)場記錄,經(jīng)過本人審閱。 ● ● ● 在Google人工智能AlphGo戰(zhàn)勝歐洲圍棋冠軍之后,Google有個說法叫做人類最后的智力驕傲即將崩塌,其實我覺得這個說法言過其實,人類最絢爛、最精華的東西遠不是圍棋,例如人能欣賞一則幽默,解決剛剛遇到的一個問題,但機器完全做不到,人類的思維遠不是說因為在圍棋上失敗而失去了一切。 很多人說IBM的Watson機器人(2011年,在美國的電視智力競賽節(jié)目中打敗了人類對手)比人聰明,實際情況并非如此,它做智力測驗比一般人好。設計師事先給它設計一個游戲規(guī)則,類似我們小時候電視上經(jīng)常出現(xiàn)的問答,回答對了加十分。根據(jù)這個規(guī)則,Watson最后得了77147分,得分最高,所以細究一下,高分不一定表示它聰明,當你讓它做一件要求推理的事情時,這個機器就會崩掉,所以我們要跟它比推理能力,而不是簡單的機械記憶。 最近兩年,在拉斯維加斯全球消費電子展(CES)上的自動駕駛也很熱,很多人希望將來我們的汽車也能自動駕駛,但目前的情況是,如果有一天自動駕駛汽車放到你面前,你不會開,因為程序很繁瑣。真正地要機器跟人類的駕駛員那樣高度自動化,目前還遠遠達不到,所以這也僅僅只是一個夢想而已。 有人曾說,未來大概有七百多種職業(yè),包括速記員、導游、客服、秘書、司機不再需要人來擔任。我想列舉一例,1950年,人工智能剛剛出現(xiàn)的時候,就有人預測秘書會被機器人代替,但從1950到現(xiàn)在,秘書有被機器代替了嗎?所以現(xiàn)在重提將來會有750余種工作被機器代替,這個預測實在太大膽。像客服、導游這么復雜的工作,機器要代替人還非常難。 從科普雜志到時尚雜志都在宣揚機器智慧超越人類,都只是一種假象,人工智能的核心科學難題,50年前到現(xiàn)在還沒有一個解決,以前人工智做不了的事情現(xiàn)在仍幾乎不能做,只不過現(xiàn)在計算機的速度快了,好像看起來有所改進,其實改進不是很大。真正的理論突破沒有,大多只是漸進式工程進步而已。一個最好的例子就是自然語言理解,以前人們希望計算機能夠翻譯論文,現(xiàn)在只能做到大大限制主題后的簡單問答。 人工智能通常包含兩件事情:第一件事情我們首先要了解人類智能的本質是什么,生物體(如人)的智能如何實現(xiàn)。人類在千百萬年的演化過程中,進化出一個非常完善的大腦,所以我們首先弄清楚大腦如何工作,人類智能的本質是什么;第二件事情,我們知道了大腦的工作原理,哪怕只知道一點點,就可按照大腦的工作機制,設計一些算法或硬件來展現(xiàn)智能機器——任何一項做人工智能的研究都包含這兩件事。 人工智能之所以能求解,必須滿足兩個條件: 第一、要求能夠精確定義的問題; 第二、問題的范圍一定要非常有限,能夠被精確定義。 現(xiàn)實的情況是,我們生活中大量的問題,是不能被精確定義的,范圍也不受限,以近日谷歌AlphaGo與李世石九段的圍棋比賽為例,圍棋的黑子白子、格子規(guī)范,棋局設計,用計算機表示它們,均能夠做到。所以對人工智能來說,一定要定義地非常精確,范圍非常有限,只有這樣它們才能大概知道在做怎樣的事情,以及如何做好。 回歸到人工智能研究的細節(jié)上來,人工智能首先研究的是推理,推理很基礎簡單,相當于中學生的幾何題:告訴你已知條件,然后證明出來,如證明兩條線垂直或兩個角相等,這是人工智能研究的早期核心之一。 其次,人有非常強的學習能力,計算機以前不能學習,設定程序后只能按程序做,不會解決遇到的新問題。人類希望它像同自己那樣擅于學習,于是讓它“讀”很多書,“看”很多東西,把“前輩”的經(jīng)驗記下來,于是計算機的學習能力得到提升。 第三個方面,問題的求解,在設置起始狀態(tài)以及最終狀態(tài)后,以最快的速度從這種情況挪到那種情況,何種方式速度最快最好,這是人工智能研究的第三個問題。 第四個問題是規(guī)劃,例如走迷宮,我們需要規(guī)劃一條路線,從這里走進去,從那里走出來,人工智能可以做出這樣的決策。 第五個問題是自然語言的理解,自然語言理解里面一個非常核心的應用是機器翻譯,自然語言理解非常困難,解決這個問題,要比計算機下圍棋打敗人難很多,所以如果機器翻譯搞定的話,我們就不用花那么多的時間學習英語,就可以跟老外順暢地交流,但我們發(fā)現(xiàn)這是很困難的事情。 第六個研究是模式識別,如圖象理解,比如場景是一張圖里有桌子、茶、雕像,還有語音播放,人類的視覺以及聽覺能很好地識別它們。機器的模式識別能力目前在簡單的東西上已做得不錯,如指紋識別、印刷體識別、手寫體識別以及汽車入庫車牌識別都做得不錯,但在復雜的情況下還做不到,仍有局限性,例如車牌識別僅限于車停在恰當?shù)奈恢?,如換成大馬路等其他場景,識別就不好了,所以現(xiàn)在的模式識別做得好的事情屈指可數(shù)。如果要把模式識別研究清楚,未來十年、二十年,我們能夠取得很大的進步嗎?我不敢估計。類似的領域還有很多。
人類智能的物質基礎是大腦中的神經(jīng)元。它們大概有1000億個,神經(jīng)元如何工作以及多個神經(jīng)元構造如何工作,研究它們對人類進步的意義很大。今年大腦科學計劃將成為國家未來科學研究一個非常重要的方向。如果把腦科學研究成果跟人工智能程序設計連接在一起,這會給人工智能設計帶來很大的想象空間。 目前,人類的視網(wǎng)膜從解析度上來看已不如高端的照相機,但人的視網(wǎng)膜非常復雜,視網(wǎng)膜細胞收集信息后,將信息投遞到別的細胞中去,這個信息通路的過程也很復雜。不同的細胞收集不同范圍里面的信息,部分細胞能檢測到圖象的邊界。因為有了邊界以后,人類才能看到外面的世界。 很多人說,眼見為實,其實這并不總是客觀的。因為視覺對外界物理信息主動加工,已經(jīng)解釋過一遍,所以說并不是真實的物理環(huán)境和真正的刺激,我們的主觀感知有顏色,但這并不是說自然界真的有顏色,而是我們的主觀感受。但是它會帶來好處,這就是方便我們對整個世界加工,不同的顏色表示不同的物理刺激,我們很容易將不同事物區(qū)分出來,顯然這種主觀標示刺激對我們認知世界有好處。 人工智能的模式識別以及圖像加工程序模擬視網(wǎng)膜細胞,原理與之類似。如果我們能夠模擬大腦的工作機制,寫出程序來解釋人類為什么會產(chǎn)生錯覺,從而有可能接近大腦的工作機制,就會使得我們一步步地接近大腦是怎樣工作。類腦計算是模仿大腦信息加工制造出來的硬件結構或計算程序,它的核心是根據(jù)大腦的工作機制才能做好,這是一個多學科交叉的研究領域,例如心理學、神經(jīng)科學等。通常情況下,設計計算機軟件是針對某種人工智能任務。類腦計算的核心是我們了解大腦怎么工作之后,然后再對它進行模仿。
類腦計算的發(fā)展前景以及未來應用都非常廣闊。例如,當人的視覺出現(xiàn)障礙,青光眼或由外傷導致失明,如果我們想對他進行修復,或設計一個模仿機器即可讓他看到世界。事實上,人類的視覺加工神經(jīng)通路很長,如果中間哪個環(huán)節(jié)出了問題,就會影響視力,我們可設計一些視網(wǎng)膜芯片來代替它。對于很多截癱病人,如果能通過芯片植入,將上下神經(jīng)連接起來,使其恢復正常行走或感知,這種應用的社會價值也很大,所以類腦計算跟普通人的日常生活息息相關,未來會有非常好的應用前景,當然它自身需要解決的問題還很多。 對于圍棋比賽來說,每一步我們的選擇會很多,機器同我們一樣,每一步都有很多決策需要決定,但機器每一步棋的結果會一直演化下去,直至得到最優(yōu)的選擇,而且它們這樣做很容易,對人類來說,這并非易事。如果我們將棋局上的每一個點視為一個元素,它可以是1、-1,或者是0,所以每一個點共有三種狀態(tài):黑、白和空白,這種結點數(shù)量總共有3的361次方之巨,人腦這樣做會有些困難,但人工智能可以把棋局精確地表示出來。 對于機器來說,實現(xiàn)它的效率是一個難點,即用很快的速度或方法找出哪種走步最合適。一個好的辦法是設計一個搜索程序,一個結點、一個結點地走下去,它需要判斷哪一個更好,判斷的依據(jù)來自于后面,而不依賴于前面,所以對計算程序而言,它們總能找到對自己有利的走法,人工智能的這個難點類似人類的歧路尋羊,窮盡所有可能性的方法在機器里面搜索。這理論上是可行的,但實踐上卻不容易。 接下來就是如何提高機器的效率,AlphaGo通過對很多棋譜進行深度學習,并事先對棋譜依據(jù)走法和策略進行了分類,每一個分類對應一個已知的不同策略。在設計過程中,谷歌的AlphaGo可能有一個創(chuàng)新的設計,即怎么表征棋局的當前狀態(tài)和判定假設走步的價值,比如說每走一步,它的價值是什么。這可能是通過對大量以往棋局的機器學習來做到的,它或是基于下棋規(guī)則,或是基于大量棋局與走步的配對。人工智能在每一種情況下,都有一個很好的判定。事實上,這種搜索上世紀50年代就已做到,如今仍在反復使用。 對于李世石來說,AlphaGo的背后擁有一個龐大的團隊,有做硬件的,有設計程序的,還有大量的頂尖棋手貢獻出來的棋譜。棋譜是AlphaGo經(jīng)驗的來源,也是其他大量棋手經(jīng)驗的結晶,所以把這么多人的智慧綜合到一個計算機上,來對付一個人,李世石堪稱雖敗尤榮。 事實上,圍棋是一個規(guī)則特別明確的事情,AlphaGo非常可能針對的不是模仿下棋規(guī)則,而是匹配一定區(qū)域的棋局。如果人類和人工智能比規(guī)則簡單明確的棋類,早晚要輸。 此前兩役,AlphaGo贏了,其實它并沒有真正地理解圍棋的基本原則,它唯一的概念就是布局和布局之間的關系,所以說它的程序學到的東西還很有限,并不像我們想象的那么好,所謂的類推能力是由它積累的海量樣本造成,這方面沒有創(chuàng)新,機器只知其然,不知其所以然。 人工智能發(fā)展到現(xiàn)在的一個現(xiàn)狀是:瞎子摸象。每個人看的東西都是很局部的,但是每個人都認為自己看到的就是人工智能未來的發(fā)展方向,最后大家都沒有達成一個共識。 很多人不愿意承認這種尷尬局面:我們離我們的目標仍非常遙遠,真正的人工智能也離我們很遠。盡管銀幕中的科幻電影有很多人工智能的形象,它們甚至已進化出了人的意識,但這樣的事情在現(xiàn)實世界中還不會出現(xiàn)。生物神經(jīng)系統(tǒng),特別是高級靈長目動物的大腦,是長期自然進化的結果,我們要對自然心存敬畏,不要動輒就認為它很容易被超越。 (責任編輯 葉水送 徐可) |
|
來自: 漢青的馬甲 > 《發(fā)現(xiàn)與科學》