一個充滿爭議的理論認為,感知、運動控制、記憶等大腦功能,都是大腦通過模擬預期未來,并與當下的實際體驗進行比較,才得以實現(xiàn)的。 JORDANA CEPELEWICZ 插畫:CRISTIANA COUCEIRO 6月,人工智能領域的巨擘DeepMind公司發(fā)布了一個新程序。無需人類介入,該軟件能自動從虛擬三維空間單個視角的照片推斷出整個空間的布局,并給出在其他全新視角下可能看到的畫面。只要給它幾張三維迷宮的圖片,這個叫做生成查詢網(wǎng)絡(GQN)的程序就可以模擬出整個迷宮的布局。
該程序不僅有顯而易見的技術應用前景,也讓神經(jīng)科學家頗感興趣。因為用來訓練該程序完成任務的算法利用了“現(xiàn)實和預測之間的偏差”,項目領導者之一阿里·伊斯拉米(Ali Eslami)說。
他在DeepMind的同事及論文共同作者達尼洛·雷森德(Danilo Rezende)說:“算法能夠調(diào)整它(預測性)模型中的參數(shù),使得以后再碰到相同情況時,少一些‘驚訝’。”
給定一張繪有彩色立方塊的二維圖像(左圖),人工智能程序“生成查詢網(wǎng)絡”可以推斷出立方塊的三維構型(右圖)。該人工智能背后的基本想法與神經(jīng)科學中的“預測性編碼”理論相同。 — 圖片來源:Deepmind 神經(jīng)科學家想到的,是預測性編碼理論(實際上,這正是啟發(fā)GQN團隊的靈感之一)。該理論認為,在認知過程的每一個層級,大腦都會建立模型,或者說生成信念,去預測它從低層級腦區(qū)會接收什么樣的信號,這些信念被翻譯為一種在特定情況下會有哪些感覺體驗的預期,這樣就可以解釋外界發(fā)生了什么,并理解體驗的意義。這些預測隨后被向下傳輸,反饋到低層級的感覺腦區(qū)。大腦會將反饋來的預測和實際的感覺輸入進行比較,判斷導致差別(或者說預測誤差)的可能原因,通過內(nèi)在的模型“抹平”部分差別;無法被解釋并消除的預測誤差,則作為前饋(feedforward,與反饋正相反)信號被傳輸?shù)礁邔蛹壍哪X區(qū),在那里它們被視作有價值的信息,需要加以注意并適當處理。 “這時,需要的就是調(diào)整內(nèi)在模型,即大腦的動態(tài),來抑制預測誤差?!?/span>卡爾·弗里斯頓(Karl Friston)說,他是倫敦大學學院的著名神經(jīng)科學家,也是提出預測性編碼假說的先驅之一。 心靈時間的數(shù)學原理 KARL FRISTON 意識的絕技是設想各種可能的未來中的行動與時間。 過去十年間,認知科學家、哲學家和心理學家,將預測性編碼視為一個重要理論,尤其是作為感知運作機制的有力解釋。更有人充滿野心地認為,它是可以解釋整個大腦機制的大一統(tǒng)理論。然而,很長時間以來,我們都沒有足夠的實驗工具,來直接測試該假說描述的具體機制。隨著技術發(fā)展,更顯著的新證據(jù)在近兩年開始涌現(xiàn)。同時,早期一些里程碑式的證據(jù)的可重復性受到了質疑。 — 卡爾·弗里斯頓(Karl Friston) 咖啡、奶油和狗
“我的咖啡加了奶油和__。”在這句話的空格里,似乎只有填進“糖”是最自然的。加州大學圣迭戈分校(University of California, San Diego)的認知科學家瑪爾塔·庫陶什(Marta Kutas)和史蒂文·希利亞德(Stenven Hillyard)在20世紀80年代做了一系列實驗,將上面這句話逐詞呈現(xiàn)給參與者,同時記錄他們的大腦活動。然而最結尾處不是“糖”,隨著最后一個詞顯示出來,人們看到的是“我的咖啡加了奶油和狗?!?/span>
研究者觀察到,當實驗被試看到出人意料的單詞“狗”時,他們的大腦反應更大,而且顯示出了一種特殊的腦電活動模式,他們稱之為“N400效應”,即該單詞出現(xiàn)約400毫秒后腦電波達到峰值。問題是,大腦是因為該單詞不符合句子的上下文語義而產(chǎn)生N400效應,還是因為它違反了大腦的預期?
2005年,庫陶什和她的團隊進行了另一項研究,實驗結果支持了“違反大腦預期”這一解釋。在該研究中,逐詞呈現(xiàn)的句子是:“今日微風習習,因此男孩去戶外放(fly)__”。因為“風箏”(a kite)是最有可能的結尾,因此被試會預期下一個看到詞應該是冠詞“a”。而當被試看到的是“an”而非“a”時——這就代表最后一個單詞是元音開頭,比如“飛機”(an airplane)——他們的大腦出現(xiàn)了N400效應。這時,該效應顯然和冠詞的語義無關(冠詞沒有語義),也和處理視覺刺激本身的難度無關,而是和冠詞所提供的對下個單詞的預期有關。
2005年的研究似乎非常符合預測性編碼的理論框架,但是去年4月,在《eLife》上發(fā)表的一篇論文稱,數(shù)個實驗室都無法重現(xiàn)實驗的結果。目前,其他的研究者也紛紛回應,其中一些聲稱,在復制實驗中,實驗方法存在細微差別,但對它們分析結果依然更支持預測性編碼解讀。
這些來回往復的爭辯,很大程度上反映了圍繞預測性編碼本身的爭論。類似庫陶什做的實驗可以有多種解讀:除了預測性編碼理論,還有很多模型可以解釋它們的實驗現(xiàn)象。這些實驗都不能給出預測性編碼理論的決定性證據(jù),因為它們尚未挖掘到深層機制。盡管預測性編碼理論已經(jīng)對“大腦持續(xù)做出推斷并與實際情況比較”的想法做了深入闡釋,但是理論的支持者依舊在苦苦尋找證據(jù),以證明他們講述的故事是“唯一正確版本”,并可以擴展到所有類型的認知。
貝葉斯大腦和高效計算
預測性編碼的基本觀點——大腦持續(xù)地對當下體驗做出預測并評估預測——并非一直都被當作理所當然。20世紀的主流神經(jīng)科學將大腦描述為一個特征檢測器:感知、處理、然后行動。神經(jīng)元的活動代表物理世界中刺激的在場或缺乏。比如說,視覺皮層的一些神經(jīng)元對視野中的物體邊緣反應,另一些的發(fā)放則反映了物體的方向、顏色和灰度。
但是,事實證明這個流程并非我們想象中那樣直接。進一步實驗發(fā)現(xiàn),當你的目光隨著一根長長的直線延伸到遠處時,雖然視野中的直線還在,檢測直線的神經(jīng)元會停止發(fā)放,就好像這條直線消失了一樣。而此時,神秘的“自上而下”反饋連接中,卻好像有許多信息通過。
這就輪到“貝葉斯大腦”登上舞臺了。這個根源可以追溯到19世紀60年代的普適框架徹底顛覆了傳統(tǒng)理論。該理論認為,大腦基于其內(nèi)部的模型對外部世界做概率推斷,換句話說,它在盡可能地猜測它應該對感知到的東西作何理解;這和貝葉斯統(tǒng)計原理是一致的,即用過去的經(jīng)驗和當前的體驗,判斷某個事件發(fā)生的概率。大腦并不只是消極地等待感覺輸入來驅動認知,而是持續(xù)主動地建立“世界如何運行”的假說,并用這些假說來解釋感覺體驗、補充缺失的部分。這就是為什么,有些專家認為感知是“受控的幻覺”。
按照同樣的思路,貝葉斯大腦模型也能解釋視錯覺如何產(chǎn)生。比如,屏幕上交替閃動的兩個亮點看上去像是一個點在來回移動,于是我們的大腦就無意識地將它們看作是同一個亮點。對物體移動的理解是高層級的,但是它卻能從根本上影響我們低層級的感知。大腦就是這樣填補信息空洞——在這個例子中,缺失的是物體的運動——以繪制出并不完全準確的世界圖景的。
在這個為大眾熟知的視錯覺圖片中,棋盤A格的顏色看上去明顯比B格深一些;而實際上,它們的灰度是一樣的。大腦利用周圍格子的顏色和圓柱體陰影的位置對棋盤的顏色做出推斷。在這個例子中,這種推斷產(chǎn)生了“A和B灰度不一樣”的感知,盡管物理上它們的灰度是一致的。像右圖那樣連接起兩個格子,并遮擋掉圓柱體,你能看得更清楚。 — 圖片來源:Adrian Pingstone,修改自Edward H. Adelson 盡管科學家們已經(jīng)明確了生成模型以及預期在大腦功能中的重要性,卻依然無法確切指出它們到底是如何通過神經(jīng)回路實現(xiàn)的。“相對來說,貝葉斯大腦版本的故事對于其底層的機制抱著不可知論的態(tài)度?!睈鄱”ご髮W的心靈哲學教授馬克·施普雷瓦克(Mark Sprevak)說。
說回預測性編碼理論。它為大腦如何做貝葉斯推斷提供了具體的公式。“預測性編碼”一詞原本指通信工程中一種讓遠程通信更高效的技術。因為視頻文件幀與幀之間通常包含許多冗余,壓縮數(shù)據(jù)時編碼每一幀的每一個像素很沒效率,更有效的方法是相鄰幀之間的差異進行編碼,再反向操作來解碼整段視頻。
1982年,科學家發(fā)現(xiàn)在神經(jīng)科學中也可以巧妙運用這個想法,因為它能解釋視網(wǎng)膜的神經(jīng)元如何編碼在視神經(jīng)上傳輸?shù)囊曈X刺激。人們也堅信它是大腦獎賞系統(tǒng)的運作原理:多巴胺神經(jīng)元編碼的是預期獎賞和實際獎賞間的差異強度。研究者們認為,這些預測誤差幫助動物更新未來的預期,并驅動它們的決策。
雖然那么多例子擺在這兒,過去的科學家們大多還是認為,預測性編碼只是專用于幾個特定大腦網(wǎng)絡的原理?,F(xiàn)在,運用功能核磁共振成像(fMRI)等方法的實驗已經(jīng)開始改變這個觀點了。
一個統(tǒng)一的架構
預測性編碼假說如此具有說服力,部分原因來自其強大的解釋力?!傲钗倚欧囊稽c在于,許多東西都可以在這個故事中得以闡明?!卑驳稀た死耍ˋndy Clark)說。他是愛丁堡大學的邏輯學和形而上學教授,也是預測性編碼理論專家。
首先,它將感知和運動控制統(tǒng)一納入了同一個計算過程。它們本質上是一枚硬幣的兩面:盡管使用的是兩種不同的方法,但大腦都在盡量消除預測誤差。在感知中,大腦是在調(diào)整內(nèi)部的模型;而在運動控制中,調(diào)整的是實際環(huán)境——想象一下,如果你想要舉手,而手還沒舉起來,這個差異就會產(chǎn)生巨大的預測誤差,這個誤差只需你移動手臂就能消除。
— Lucy Reading-Ikkanda/Quanta Magazine, 翻譯:顧金濤
感知和運動控制領域的一些實驗也為預測性編碼提供了最強有力的證據(jù)。例如,6月發(fā)表在《神經(jīng)科學雜志》(Journal of Neuroscience)的一篇論文中,實驗者要求被試看著屏幕,他們看到了屏幕上的單詞“kick”,隨后他們又聽到了一段音頻。音頻原本錄的是“pick”,但是經(jīng)過了音頻處理,像是壓著聲音說的,這讓大多數(shù)被試都匯報說他們聽到的是“kick”。而fMRI掃描顯示,大腦響應最劇烈的是開頭的音“p”或“k”。這說明大腦在表征預測誤差,因為如果大腦表征的僅僅是實際的感官體驗,那么響應最劇烈的應該是在屏幕上和音頻中都出現(xiàn)的“ick”,而非與預測誤差相關聯(lián)的“p”或“k”。
還有一些學者努力將預測性編碼理論擴展到感知和運動以外的領域,試圖將其定性為大腦中一切活動的“通貨”?!斑@就像是積木,能構建出不同大腦功能結構的積木,”克拉克說。不同的腦區(qū)之間交易的就是不同種類的預測。
弗里斯頓等人聲稱,這也適用于更高級的認知過程,包括注意力和決策。最近對前額葉腦區(qū)進行的計算神經(jīng)科學研究,就提示了在工作記憶和目標導向的行為方面,預測性編碼也有參與。一些研究者論證道,情緒過程也可以用預測性編碼的方式來描述:情緒可能是大腦為了減小對身體狀態(tài)(比如體溫、心率、血壓)的預測誤差而表征出的狀態(tài),當大腦認識到自己激動、焦慮和不安時,它知道的是自己的這些身體指標飆升了?;蛟S,這也是“自我”這個概念涌現(xiàn)的起點。 是什么限制了工作記憶的容量? JORDANA CEPELEWICZ 研究者發(fā)現(xiàn)當工作記憶過載時,大腦有三個腦區(qū)會失去原本的協(xié)調(diào)同步。該發(fā)現(xiàn)亦為預測性編碼理論提供了新支持。 這一系列的研究大多數(shù)著眼于借助預測性編碼理論,解釋神經(jīng)精神病和神經(jīng)發(fā)育紊亂的原理。弗里斯頓說:“如果大腦是一臺做統(tǒng)計推斷的機器,那當它出錯時,它會犯統(tǒng)計學家常犯的錯?!币簿褪钦f,它會因為高估或忽視預測及預測誤差而做出錯誤推斷。
例如,自閉癥的某些特征,可能是由于大腦無法忽略最低處理層次的感覺預測誤差而產(chǎn)生的。這可能導致對感覺的過度關注,對重復和可預測性的渴求,對某些錯覺的高度敏感以及其他反應。精神分裂癥等與幻覺相關的病癥則可能與之相反:對正在發(fā)生的事情,大腦可能會過度依賴自己的預測,而不夠重視與這些預測相矛盾的感官信息。(不過專家們也不忘提醒,自閉癥和精神分裂癥的成因是復雜的,不能簡化為單一的解釋或機制。) 自閉癥的根源在感官系統(tǒng)嗎? GEORGE MUSSER 預測性編碼理論認為,當感官輸入推翻大腦期望的時候,患有自閉癥的人便會出現(xiàn)標志性的癥狀。 耶魯大學醫(yī)學院的臨床神經(jīng)科學家菲利普·科萊特(Philip Corlett)說:“它給我們最深刻的啟示是,我們的心智功能竟然如此易受影響?!?科萊特的實驗室進行過一些實驗,他們能在健康的被試腦中建立新的“信念”,讓他們產(chǎn)生正在體驗曾經(jīng)接受過的刺激的幻覺。(在其中一個實驗中,科學家將一個圖案作為條件刺激和一個音調(diào)聯(lián)系一起,當被試看到圖案時,即使沒有聲音,他們也以為自己聽到了那個音調(diào)。)研究者正試圖弄明白這些信念是如何被轉化為感知的。通過這些研究,“我們有證據(jù)表明感受和認知并沒有那么涇渭分明?!?/strong>科萊特說,“新的信念可以被植入,并影響你的感知?!?/span>
然而,證據(jù)還不足以確證結論——直到現(xiàn)在。
聚焦一下,仔細看看
“我們的實驗工作經(jīng)常表明,實驗結果與預測性處理的假說兼容,但這并不意味著預測性編碼是最佳解釋?!?/span>施普雷瓦克說。預測性編碼理論在認知科學領域中被廣泛接受,但“在系統(tǒng)神經(jīng)科學領域,它仍然處于弱勢,” 瑞士弗里德里?!み~瑟生物醫(yī)學研究所的神經(jīng)科學家格奧爾格·凱勒(Georg Keller)說。他的實驗室正試圖用更確鑿的證據(jù)改變這一局面。 瑞士弗里德里?!み~瑟生物醫(yī)學研究所的神經(jīng)科學家格奧爾格·凱勒。他一直致力于找到預測性編碼假說的機制性證據(jù)。 — 圖片來源:Roland T?nnler 在去年發(fā)表于《神經(jīng)元》(Neuron)的一項研究中,凱勒和他的同事觀察到小鼠視覺系統(tǒng)中出現(xiàn)了一種神經(jīng)元,它們的預測能力可以隨著時間的推移變得更強。該發(fā)現(xiàn)源于一場意外:當他們開始在視頻游戲中訓練小鼠時,發(fā)現(xiàn)虛擬世界的方向弄顛倒了。通常,只要小鼠向左轉,它們就會看到視野向右移動,反之亦然。但有人不小心左右翻轉了研究人員在研究中使用的虛擬世界,因此老鼠一旦左轉,視野也會向左移動。研究人員意識到這個失誤有意想不到的價值。他們監(jiān)測小鼠腦中表征這種視野流動的信號,發(fā)現(xiàn)隨著小鼠逐漸熟悉倒置的環(huán)境,該信號也緩慢地變化著。凱勒說:“這些信號看起來像是對視野向左流動的預測?!?/span>
如果該信號表征的只是小鼠的視覺感官體驗,那么小鼠進入虛擬世界時它們就會立即翻轉。如果它們是運動信號,根本就不會翻轉。事實是,“它關乎識別預測,”凱勒說,“給定運動方向下,對視野流動的預測?!?/span>
“這項工作提供了一種前所未有的證據(jù)?!笨死苏f,“這項證據(jù)具體到了非常局部的每個細胞、逐個層級,于是我們可以清晰地看到,預測性編碼是最佳適配模型?!?/span>
巧合的是,幾乎同時,有人在獼猴大腦的面部識別腦區(qū)發(fā)現(xiàn)了類似的現(xiàn)象。以往的研究已經(jīng)顯示,該腦區(qū)神經(jīng)網(wǎng)絡的較低層級上,神經(jīng)元對以方向為基礎的面部信息編碼,比如說,有些神經(jīng)元專門在看到側臉時發(fā)放。而在較高的層級,神經(jīng)元以更為抽象的方式表征面部信息,它們在乎的是臉的“身份”,而非位置。 在這個獼猴研究中,研究者先訓練猴子,讓它們看兩張臉,先出現(xiàn)的一張臉總是透露一些有關第二張臉的信息,讓獼猴可以對第二張臉進行一定預測。隨后,實驗者用特定的方式干擾它們的預期,比如用不同角度呈現(xiàn)第二張臉,或者兩張臉沒有絲毫聯(lián)系。結果,在面部處理網(wǎng)絡的低級神經(jīng)元發(fā)現(xiàn)了與面部朝向無關的預測誤差——獼猴預測“身份”出了差錯。這些錯誤源于系統(tǒng)較高階層,也就是說,低階神經(jīng)在比較感官輸入與高階傳輸下來的預測時,產(chǎn)生了錯誤。
“在那個系統(tǒng)中發(fā)現(xiàn)了預測誤差,并找到了預測的具體內(nèi)容,讓我很激動?!痹撜撐牡牡谝蛔髡?,德國哥廷根歐洲神經(jīng)科學研究所的神經(jīng)科學家卡斯帕·施維茲克(Caspar Schwiedrzik)說。
馬克斯·普朗克經(jīng)驗美學研究所的研究員露西亞·梅羅妮(Lucia Melloni)則稱,她的小組在人類實驗搜集到的一些神經(jīng)數(shù)據(jù)也可以用預測誤差解釋。
尋找超級預測機器的競賽
支持大腦采用預測性編碼的證據(jù)似乎更強大了,但不是所有人都被說服了。一些科學家承認這個理論可以解釋認知的某些方面,但并不認同它可以解釋一切。還有些人絲毫沒有被預測性編碼理論打動。紐約大學心理學教授大衛(wèi)·海格(David Heeger)提出,關鍵在于區(qū)分“預測編碼”(重點是高效地傳輸信息)以及“預測處理”(他將其定義為做出預測的歷時性過程)這兩個概念。 他說:“過往的文獻中存在很多混淆,因為那些研究者以為只要不加區(qū)分地一鍋亂燉就可以了?!彼f, “這種做法有時候會導致錯誤,甚至可能把研究的大方向都帶偏了?!彼e例說明道,在某些情況下,其他類型的貝葉斯模型可能會提供更準確的腦功能描述。
該領域的許多專家普遍認同的是,這項研究在機器學習領域的應用潛力不可估量。目前,絕大多數(shù)人工智能研究都不涉及預測編碼,而是關注其他類型的算法。
但弗里斯頓認為,在深度學習環(huán)境中建立預測編碼架構,可以使機器更接近智能。
DeepMind的GQN就發(fā)揮了這一潛能。去年,蘇塞克斯大學的研究人員甚至使用包括預測編碼功能的虛擬現(xiàn)實和人工智能技術,創(chuàng)建了他們所謂的“幻覺機”,這種工具能夠模擬通常由迷幻藥物引起的幻覺狀態(tài)。
通過比較預測編碼模型與其他技術的表現(xiàn),機器學習領域的進展還可以為我們提供關于大腦的新洞見。至少,將預測編碼引入人工系統(tǒng)可以顯著提高這些機器的智能水平。
但在此之前,還有很多工作要做。科學家需要將凱勒、施維茲克等人正在進行的研究繼續(xù)推進,以回答大腦在哪些地方進行內(nèi)部表征等問題。此外,類似的實驗是否能夠發(fā)現(xiàn)支持預測性編碼參與更高級的認知過程的證據(jù),目前也懸而未決。
格拉斯哥大學的神經(jīng)生理學家拉爾斯·木克里(Lars Muckli)指出,預測性編碼“對于神經(jīng)科學來說,就像演化論對于生物學一樣重要”。但就目前而言,施普雷瓦克表示,“還不到判決的時候?!?/span> 本賬號系網(wǎng)易新聞·網(wǎng)易號“各有態(tài)度”簽約賬號 編譯:顧金濤 校對:有耳 編輯:EON https://www./to-make-sense-of-the-present-brains-may-predict-the-future-20180710/ 城市讓動物更聰明了? 斯里蘭卡的一只神秘野貓也許能告訴我們答案。 往期回顧 深讀 1 # 神經(jīng)科學 2 # 認知科學 3 # 認知科學 4 # 人工智能 Messages from the unseen world_ 神經(jīng)現(xiàn)實 | 大腦 心智 認知 神經(jīng)現(xiàn)實是公益的科學傳播組織,專注于神經(jīng)科學、認知科學、神經(jīng)病學和精神病學等領域的深度報道和前沿解讀。點擊“閱讀原文”,進一步了解我們。 |
|
感谢您访问我们的网站,您可能还对以下资源感兴趣:
日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区