日韩黑丝制服一区视频播放|日韩欧美人妻丝袜视频在线观看|九九影院一级蜜桃|亚洲中文在线导航|青草草视频在线观看|婷婷五月色伊人网站|日本一区二区在线|国产AV一二三四区毛片|正在播放久草视频|亚洲色图精品一区

分享

【委員觀點】復(fù)旦大學(xué)張軍平:愛犯錯的智能體 — 視覺篇(二) :顛倒的視界

 親斤彳正禾呈 2019-04-13

上回講到,光學(xué)倒像這一簡單的現(xiàn)象,在何時糾正和如何完成上,還沒有形成統(tǒng)一和完美答案的。除此以外,以下三種情況的顛倒視界也會影響人的判斷,導(dǎo)致錯判或判斷障礙,甚至產(chǎn)生光學(xué)幻覺。

一、人臉翻轉(zhuǎn)效應(yīng)(Face Inversion Effect)

圖1是網(wǎng)絡(luò)上經(jīng)常能看到的。左圖是一個老太太。但如果把圖像顛倒過來后,卻能看到一位戴著皇冠的美女。類似的顛倒錯覺圖還有不少。這類圖產(chǎn)生兩義性的結(jié)果,主要緣于人的視覺系統(tǒng)具有整體結(jié)構(gòu)觀和依賴人的先驗知識或以往經(jīng)驗。

觀看一張人臉圖時,人們會自然地把眼睛下面的結(jié)構(gòu)按鼻子、嘴巴、脖子的次序依次排序去聯(lián)想和匹配,而眼睛上方的結(jié)構(gòu)則往頭發(fā)、頭飾去想像。很少人會不按這樣的結(jié)構(gòu)次序來反向思維。它表明,如果忽略了與生活常識中次序相反的細節(jié)結(jié)構(gòu),就有可能產(chǎn)生顛倒錯覺。當然,如果你有倒過來閱讀習(xí)慣的,其實也能從老太太的圖上直接看到倒過來的美女。

圖1:顛倒錯覺中的老太太與美女畫像

更有意思的是,某些圖像,尤其是人臉,即使只是簡單地翻轉(zhuǎn),也可能導(dǎo)致認知障礙。

1969年,科學(xué)家Yin第一個在文獻中報道了:翻轉(zhuǎn)臉對于識別的影響要大于其它范疇的圖像[1]。自此以后,很多科學(xué)家開始研究人臉翻轉(zhuǎn)效應(yīng),并試圖給出合理的解釋。

加拿大安大略省女王大學(xué)(Queen’s University)的三位研究人員Freire等曾在2000年展開深入研究[2]。他們首先將多個人臉圖像進行統(tǒng)計平均,以形成平均臉?;趯D2平均人臉的研究實驗,他們分析了人臉逆轉(zhuǎn)效應(yīng)(Face Inverse Effect)。

他們注意到,在正臉情況下,如果從整體結(jié)構(gòu)或構(gòu)型(configural)的角度出發(fā),人能夠以81%的精度區(qū)分人臉。當人臉被翻轉(zhuǎn)后,就只有55%的識別精度了。而如果要求測試者辨識人臉上的特征,如眼睛、眉毛、鼻子之類的,那么翻轉(zhuǎn)的影響就很輕微。正常臉的識別精度是91%,翻轉(zhuǎn)了也有90%的精度。如果考慮延遲的影響,他們發(fā)現(xiàn)隔1到10秒,讓測試者重新去識別,不管是正臉還是翻轉(zhuǎn)臉,在構(gòu)型上或特征上的差異都能正確識別,人臉逆轉(zhuǎn)效應(yīng)似乎消失了。從這些實驗,他們推斷,人臉逆轉(zhuǎn)效應(yīng)中起主要作用的是構(gòu)型,即整體結(jié)構(gòu)對識別的影響更大。但這也可以算作構(gòu)型編碼的一個缺陷,比如雙胞胎就很難通過構(gòu)型編碼來區(qū)分。

由于在時間上識別率上的差異極細微,他們還推斷,這種構(gòu)型缺陷主要發(fā)生在人臉處理的編碼階段,而不是后面的人臉存儲階段。這與圖1中我們不容易發(fā)現(xiàn)老人圖像中隱藏的美女的情況是吻合的。

圖2 人臉逆轉(zhuǎn)效應(yīng),左邊,正臉(Upright),右邊,顛倒臉(Inverted);中間的字Featural表示“基于特征的”[2]。第二行表明人臉構(gòu)型上的垂直(Vertical)距離在翻轉(zhuǎn)后會被錯判。

另外,科學(xué)家Carbon和Leder[3]在研究中發(fā)現(xiàn),正臉比翻轉(zhuǎn)后的臉的全局信息能更快獲得,而在翻轉(zhuǎn)臉后,特征的提取則要先于整體信息進行處理。而要在短時間(如26毫秒)處理局部特征信息,則具有上下文信息的整體結(jié)構(gòu)處理是必要的。

總的來說,翻轉(zhuǎn)效應(yīng)影響了人對人臉的空間關(guān)系,即人臉構(gòu)型的認知[4]。但是,人臉翻轉(zhuǎn)效應(yīng)還沒有一個終結(jié)者的解釋。有興趣的朋友可以在網(wǎng)絡(luò)上搜索”Face Inverse Effect”,應(yīng)該可以查到不少最近的相關(guān)文獻。

相反,現(xiàn)有的人工智能技術(shù)是不用擔心翻轉(zhuǎn)對識別性能的影響,尤其在現(xiàn)在引入生成式對抗網(wǎng)絡(luò)和數(shù)據(jù)增廣技術(shù)后。翻轉(zhuǎn)被作為豐富人臉訓(xùn)練數(shù)據(jù)集的手段之一,因此,不會損害人臉識別算法的預(yù)測性能。

但從認知的角度看,這是否意味著我們在提高預(yù)測能力的同時,有可能損失了“擬人”的某些認知功能呢?也許可以推斷,人臉翻轉(zhuǎn)效應(yīng)表明,現(xiàn)有的人工智能技術(shù)在人臉識別的處理方法上和人在人臉的認知上存在根本的不同。理解這些差異,也許是通向“強”人工智能和混合智能方向的線索之一。

二、正片負片的人臉識別

不僅在圖像方向上的翻轉(zhuǎn)會引起認知障礙,甚至對圖像做簡單的強度翻轉(zhuǎn)也會讓原來人臉識別變得更困難。

圖3人臉圖像的正片(左)和負片(右),以及變換公式(中)。中間圖里,橫坐標可以認為是輸入的圖像強度,縱坐標是變換后的強度。斜線是正負片的翻轉(zhuǎn)方式,即白變黑,黑變白。

圖3左圖是一張正常的人臉,如果對其用中間圖的函數(shù)做翻轉(zhuǎn)變換,即白變黑,黑變白的簡單翻轉(zhuǎn),則有了右圖的負片圖像。雖然人在識別和記憶左圖人臉時,是不太需要費腦筋的。雖然用的函數(shù)變換也很簡單,但對于右圖,如果沒有左圖做參照,人可能很難聯(lián)想其真實的相貌,更不用說做有效識別了。這種差異也許是由于日常生活缺乏負片學(xué)習(xí)造成的,因為人的視網(wǎng)膜細胞只是感光細胞,只能接受正能量。也許是由于智能體缺乏這一類數(shù)學(xué)計算的能力,沒有演化出有效的辦法,可以在大腦自動將中圖的簡單函數(shù)求反,盡管智能體可以實現(xiàn)前一篇中所講述的、光學(xué)倒像的自動糾正。

三、正負倒影

圖4 耶酥光學(xué)幻覺

除了以上兩種顛倒,人的視覺還有翻轉(zhuǎn)顏色的“特異功能”。如圖4所示,如果你盯著這張圖中間的四個點靜看30秒,再去看一面白色的墻或屏幕的空白處,或不停的眨眼,你的眼前便會浮現(xiàn)出耶酥的影子。這個影子看上去就像是由圖上黑色背景內(nèi)部的部分,通過黑變白,白變黑互補所形成的圖像。

至于為什么會有這樣的結(jié)果,也是眾說紛紜。比較靠譜的解釋是,這是一種圖像烙印(burn-in)或持續(xù)性記憶現(xiàn)象。當一個非常明亮的目標處在視野的關(guān)注焦點時,會在視網(wǎng)膜上短暫地打上烙印。如果隨后閉眼或者重復(fù)性地眨眼,這個烙印仍然還會持續(xù)一段時間。

也有觀點說,人的眼睛是由視錐和視桿細胞組成。其中,視錐細胞主要負責(zé)環(huán)顧四周。如果長期只盯著同一目標看的話,那視錐細胞就容易工作過度,導(dǎo)致快速疲勞。結(jié)果,如果離開盯著的目標后,疲勞的視錐細胞不會迅速反饋新看到的顏色到大腦,比如新看到的白色墻壁。而大腦還需要對老的信息進行解釋,因為它并沒有收到強的、新的信號。

還有觀點將其稱為視覺后效(Aftereffects in Visual)。即連續(xù)注視相同圖形之后,會導(dǎo)致感知被影響,隨后影響感受到的圖形結(jié)果。這種知覺現(xiàn)象最早于1925年由E.H.維爾霍夫發(fā)現(xiàn),后來很多科學(xué)家都對這一現(xiàn)象進行了系統(tǒng)的研究[5]。

這些觀點都認同,隨著視網(wǎng)膜神經(jīng)細胞功能的恢復(fù),這個現(xiàn)象會逐漸消退。因為這種現(xiàn)象能帶來很多奇特的視覺效果,所以,這或多或少可以解釋,為什么大多數(shù)藝術(shù)館里都是以白墻來裝飾的。

不管怎么說,人眼的這些錯覺現(xiàn)象表明,人內(nèi)在的認知行為,可能比我們現(xiàn)在人工智能所能實現(xiàn)或理解的功能要復(fù)雜,需要做更多的探索。

今天就寫到這里。下回介紹智能體的另一種視覺錯覺。

張軍平

2018年7月5日

參考文獻:

1.Yin R K. Looking atupside-down faces. Journal of Experimental Psychology. 1969,  81: 141 – 145

2.Freire A, Lee K, Symons LA. The face-inversion effect as adeficit in the encoding of configural information: direct evidence. Perception.2000;29(2):159-70

3.Carbon CC, Leder H.  Whenfeature information comes first! Early processing of inverted faces. Perception.2005;34(9):1117-34

4.Rossion B, Gauthier I.How does the brain process upright and inverted faces. Behavioral and cognitiveneuroscience reviews. 2002, Mar; 1(1): 63-75.

5.http://www.baike.com/wiki/圖形后效

人物介紹:

圖3是計算機視覺領(lǐng)域的杰出人物之一,加州大學(xué)圣特芭芭拉分校計算機系的Matthew Turk教授。他和Alex Pentland在1971年提出的特征臉(Eigenface)算法,在深度學(xué)習(xí)興起前,是計算機視覺領(lǐng)域在人臉識別和其他目標識別中的經(jīng)典算法之一。目前該算法的學(xué)術(shù)谷歌引用達17000余次。

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多