講習(xí)班開(kāi)班公告 為繼續(xù)推進(jìn)和深化混合增強(qiáng)智能的研究發(fā)展,中國(guó)自動(dòng)化學(xué)會(huì)混合智能專業(yè)委員會(huì)將于2018年9月8-9日在西安舉辦首期混合增強(qiáng)智能前沿講習(xí)班,主題是“人在回路的混合增強(qiáng)智能”。此次講習(xí)班邀請(qǐng)到中國(guó)工程院院士、西安交通大學(xué)鄭南寧教授,中國(guó)自動(dòng)化學(xué)會(huì)副理事長(zhǎng)王飛躍教授、澳門大學(xué)陳俊龍教授等11位一線的權(quán)威專家系統(tǒng)闡釋人在回路的混合增強(qiáng)智能前沿?zé)狳c(diǎn)問(wèn)題,深入研討混合增強(qiáng)智能的基礎(chǔ)理論、關(guān)鍵技術(shù)和支撐環(huán)境,分享最新學(xué)術(shù)動(dòng)態(tài)。 報(bào)名詳情請(qǐng)點(diǎn)擊:中國(guó)自動(dòng)化學(xué)會(huì)首期混合增強(qiáng)智能前沿講習(xí)班 先看張圖。大家看看圖1里面,有什么東西呢?一群雜亂無(wú)章的黑點(diǎn)塊,還是其他?如果我說(shuō),里面有一條低垂著頭的斑點(diǎn)狗,可能還有一棵長(zhǎng)著茂密樹(shù)葉的樹(shù),你都能看見(jiàn)嗎? 圖1 樹(shù)旁的斑點(diǎn)狗 也許能,也許不能,因?yàn)椴皇敲總€(gè)人都見(jiàn)過(guò)斑點(diǎn)狗的姿態(tài)。但這只看不見(jiàn)的“斑點(diǎn)狗”卻引出了一個(gè)人工智能的話題,一個(gè)關(guān)于“機(jī)器”圖像分割和“心理”圖像分割的話題,一個(gè)客觀與主觀圖像分割的話題。 圖像分割,簡(jiǎn)而言之,就是把圖像中的(多個(gè))目標(biāo)和背景分離開(kāi)來(lái)。它是計(jì)算機(jī)視覺(jué)和圖像處理領(lǐng)域的經(jīng)典研究方向,但至今仍未得到圓滿解決。對(duì)于人工智能而言,它也是重要的基石。因?yàn)樗男阅軆?yōu)劣決定了多數(shù)人工智能應(yīng)用的有效性。比如智能駕駛,人、車、交通標(biāo)志、路面、建筑物如果不能有效從監(jiān)控的視頻中進(jìn)行準(zhǔn)確分離,那么智能駕駛就無(wú)法實(shí)用。比如視頻摘要和圖像理解,如果不能把圖像或視頻中的目標(biāo)及目標(biāo)關(guān)系提取出來(lái),也會(huì)碰到類似的問(wèn)題。再比如智能服務(wù)機(jī)器人,如果不能將待服務(wù)的主人或顧客從視頻中識(shí)別出來(lái),那也就無(wú)法提供有效的服務(wù)。 不管用何種方法提取目標(biāo)或背景,有標(biāo)簽的監(jiān)督學(xué)習(xí)、或無(wú)標(biāo)簽的非監(jiān)督學(xué)習(xí)也好,基于每個(gè)目標(biāo)或類別中心的方法也好,把圖像看成節(jié)點(diǎn)和連接邊組成的圖模型的方法也好,基于類似新華字典的視覺(jué)詞包(Bag of visual words)方法也好,基于深度學(xué)習(xí)的圖像分割也好,對(duì)目標(biāo)的結(jié)構(gòu)假設(shè)基本上是一致的。一般都假設(shè)了目標(biāo)內(nèi)部是同質(zhì)地的、空洞是比較少的,目標(biāo)與背景之間的邊界是明顯的、少鋸齒狀、盡量光滑的。圖2就是一個(gè)標(biāo)準(zhǔn)的圖像分割示例。 圖2 上圖:彗星;下圖:經(jīng)過(guò)圖像分割后的慧星,白色:慧核;藍(lán)色:離子慧尾;紅色:塵?;畚?br/> 另外,衡量圖像分割質(zhì)量?jī)?yōu)劣,有兩類標(biāo)準(zhǔn)。要么是人為先把真正的分割結(jié)果標(biāo)記好,再通過(guò)圖像相似性或信噪比指數(shù)來(lái)客觀評(píng)判;要么是視覺(jué)上根據(jù)個(gè)人經(jīng)驗(yàn)做主觀分析和比較。前者與人感知的圖像分割存在一定偏差,有偏好選擇定量好但視覺(jué)效果差的圖像分割結(jié)果的風(fēng)險(xiǎn);后者則容易陷入“公說(shuō)公有理、婆說(shuō)婆有理”的尷尬局面,讓人對(duì)圖像分割質(zhì)量的好壞沒(méi)什么底。因?yàn)橛锌赡苣承﹫D的分割效果好,但某些圖效果又很不好,難以驗(yàn)證其可推廣性。 除此以外,圖像分割還具有多義性。如圖3中花瓶與人、ABC和12, 13, 14中的B與13、人臉正面和側(cè)面的圖。這些圖都反映了主觀意識(shí)和上下文在圖像分割中的重要性,也表明了圖像分割并非像字面意義那么簡(jiǎn)單好處理。 圖3:上:花瓶與人;中:13與B; 下:正臉/側(cè)臉? 至于看不見(jiàn)的斑點(diǎn)狗,它涉及到另一層的“圖像分割”---- 主觀意識(shí)下的圖像分割和目標(biāo)提取。圖像中本沒(méi)有顯明的斑點(diǎn)狗,可是當(dāng)給予線索暗示后,人會(huì)根據(jù)提示,從自己先前的知識(shí)中,合成潛在的目標(biāo)形狀,并在圖像中進(jìn)行匹配、分割和形成最接近的目標(biāo)結(jié)構(gòu)。 為什么會(huì)有這樣的情況出現(xiàn)呢?心理學(xué)中,有個(gè)叫格式塔(Gestalt)心理學(xué)的流派分析過(guò)這一現(xiàn)象,并將其歸結(jié)為涌現(xiàn)(Emergence)。 在其框架下,感知到一只達(dá)爾馬提亞狗(俗稱斑點(diǎn)狗)正在茂盛的樹(shù)下嗅著地面的過(guò)程稱為涌現(xiàn)。但與常規(guī)的圖像分割不同,人在辨識(shí)這只狗時(shí),并不是通過(guò)先找到它的每個(gè)局部結(jié)構(gòu)如腿、耳朵、鼻子、尾巴等,再將其拼成整體來(lái)推斷狗的;而是將那些與斑點(diǎn)狗相關(guān)的黑點(diǎn)作為一個(gè)整體、一次性的感知成狗。然而,格式塔心理學(xué)也只是描述了這一現(xiàn)象,并沒(méi)有解釋這個(gè)涌現(xiàn)是如何在大腦中形成的。 有種解釋是,人會(huì)根據(jù)自己習(xí)得的經(jīng)驗(yàn)來(lái)分析圖像,并盡可能與自己的經(jīng)驗(yàn)去匹配。數(shù)學(xué)上,稱這種經(jīng)驗(yàn)為先驗(yàn)知識(shí)。尤其是當(dāng)遇到毫無(wú)線索的圖像時(shí),人會(huì)優(yōu)先根據(jù)先驗(yàn)知識(shí)或暗示來(lái)尋找最可能的答案。于是,你便可以從圖1中看到一只“斑點(diǎn)狗”了。 根據(jù)先驗(yàn)知識(shí)或經(jīng)驗(yàn)來(lái)形成對(duì)圖像內(nèi)容和自然界的景色進(jìn)行想象和判斷的例子不在少數(shù)。比如圖4中的平遠(yuǎn)南臺(tái)的臥佛山、桂林漓江的九馬畫(huà)山、甚至月球上的疑似外星人飛船等。 圖4:上:平遠(yuǎn)南臺(tái)臥佛;中:桂林九馬畫(huà)山;下:月球上的疑似飛船 但這種整體結(jié)構(gòu)的形成又恰恰是“客觀”圖像分割很少能做到的。首先,人感知到的“斑點(diǎn)狗”并不符合圖像分割的客觀定義,如同質(zhì)性、少洞性、邊界光滑性和差異性。斑點(diǎn)狗與背景幾乎是相同紋理的,斑點(diǎn)狗內(nèi)部和外部的差異極小,邊界也不清晰,甚至人也很難把其邊界唯一的勾勒出來(lái)。其次,圖像匹配的相似度也不高,因?yàn)橹皇切嗡?,并非百分之九十的精確相似。在計(jì)算機(jī)視覺(jué)中,有可能第一時(shí)間就被判斷成異常點(diǎn)或因?yàn)榈陀陂撝刀慌抨?duì)。即使是將其視為認(rèn)證任務(wù)(即:非此即彼)而非分類任務(wù),識(shí)別算法也不見(jiàn)得能有多高的準(zhǔn)確定位能力。第三,他能形成的聯(lián)想會(huì)超出圖像分割本身的范疇。圖像分割的目的是純粹的。而聯(lián)想?yún)s是基于每個(gè)人長(zhǎng)年耳濡目染構(gòu)建的知識(shí)庫(kù)。所以,才會(huì)“看到”圖上的飛船,由其比例大小才會(huì)猜測(cè)非人力可為,進(jìn)而聯(lián)想到外星文明等。 這種上下文的聯(lián)系表達(dá),盡管已經(jīng)有一些看圖說(shuō)話(image captioning)的研究成果,但目前的結(jié)果,從人工智能和計(jì)算機(jī)視覺(jué)角度來(lái)看,都還沒(méi)法與人類抗衡。因?yàn)?,他需要的知識(shí)庫(kù)更為龐大,如果只靠枚舉,很容易出現(xiàn)曾經(jīng)流行的專家系統(tǒng)中的組合爆炸問(wèn)題。 除了人的先驗(yàn)知識(shí)能影響對(duì)圖像中目標(biāo)的判斷外,還有一個(gè)更為簡(jiǎn)單的因素,卻能嚴(yán)重影響人對(duì)目標(biāo)的判斷,下回書(shū)表。 參考文獻(xiàn): 1. Wikipedia. Gestalt Psychology. Retrieved from http://en./wiki/Gestalt_psychology. Last accessed on February 18th 2007. 2. Carlos Pedroza, Visual Perception: Gestalt Laws, College of Education, San Diego State University. Retrieved at April 8, 2007. 作者:張軍平 |
|
來(lái)自: 親斤彳正禾呈 > 《科創(chuàng)》