跨界 我是理科生 混進(jìn)了一詩(shī)歌群 學(xué)習(xí)與賞析 詩(shī)歌中的意象與意境 有天好奇地問(wèn)了句 為什么 詩(shī)歌一天能寫好多 科研一年才一點(diǎn)點(diǎn) 靈感怎么差那么多? 于是 群里炸開(kāi)了鍋 有人說(shuō) 科研哪要靈感 有人說(shuō) 科研和科學(xué)研究 你知道區(qū)別嗎 有人說(shuō) 你做的是科研嗎 一點(diǎn)數(shù)學(xué)也沒(méi)有 我只好 展示了一些 我在 數(shù)學(xué)鄙視鏈 最底端的 統(tǒng)計(jì)學(xué)成果 還有 物理教學(xué)的 一點(diǎn)心得 結(jié)果 整個(gè)群里 只有 兩個(gè)理科生 在激烈地 辯論著 偶爾會(huì)有人發(fā)表情包?場(chǎng) 群主最后 不得不出面 嗨,兩位同學(xué) 這里是文學(xué)群 請(qǐng)不要討論不相關(guān)的內(nèi)容 個(gè)體成群后,才便于延續(xù)和壯大。人類和非人智能體在結(jié)成群體的進(jìn)程中,從生存需求的共生到精神需求的依賴,經(jīng)歷了蜿蜒曲折的變化和調(diào)整,最終形成了精彩紛呈、各式各樣的群體。而聚集成群的個(gè)體,會(huì)與獨(dú)立存在或獨(dú)處時(shí),有一些明顯的區(qū)別[1]。那群體的行為是如何體現(xiàn)的呢?它對(duì)智能有何影響,又有哪些錯(cuò)覺(jué)呢? 一、群體智能 人類對(duì)群體行為的研究年代比較悠久。我國(guó)著名科學(xué)家錢學(xué)森先生在上世紀(jì)90年代曾提出綜合集成研討廳的體系。他強(qiáng)調(diào)專家群體應(yīng)以人機(jī)結(jié)合的方式進(jìn)行協(xié)同研討,共同對(duì)復(fù)雜巨系統(tǒng)的挑戰(zhàn)性問(wèn)題進(jìn)行研究。而將群體行為關(guān)聯(lián)至智能學(xué)習(xí)則常從兩個(gè)方面出發(fā),一是分析宏觀的群體表現(xiàn),一是審視微觀的群體行為。宏觀主要從非人智能體的角度著手,以觀察動(dòng)物的群體行為為主。 天上的飛鳥比較容易看到的,但是形成能變換各種形狀的飛鳥群卻已不多見(jiàn)(圖1)。不多見(jiàn)的原因與人類曾過(guò)度使用化學(xué)藥品和肥料有關(guān),美國(guó)科普作家蕾切爾·卡遜在其1962年的科普書《寂靜的春天》介紹過(guò)。不過(guò)偶爾還能見(jiàn)到些,所以1995年Eberhart和Kennedy博士就分析了飛鳥集群覓食的行為。他們發(fā)現(xiàn)當(dāng)鳥群需要的食物處在鳥群生活的某個(gè)區(qū)域時(shí),在搜索食物時(shí),每只鳥不僅會(huì)受自己飛行的路徑影響,還會(huì)受和它相鄰鳥群的局部飛行路線,以及鳥群以群體的整體飛行路線所影響。鳥群會(huì)通過(guò)共享這些個(gè)體和群體的信息,并通過(guò)不斷交換和更新這些信息,最終鳥群能用“最優(yōu)”的效率找到食物?;谶@一觀察,Eberhart和Kennedy博士提出了一套群體智能算法,稱為鳥群優(yōu)化算法 (Bird Swarm Optimization)。如果把每只鳥假設(shè)成一顆粒子,一群鳥群則構(gòu)成粒子群,則鳥群算法還有個(gè)更一般的名字,叫粒子群優(yōu)化算法 (Particle Swarm Optimization,簡(jiǎn)稱PSO)[2]。 不僅天上的飛鳥有群體行為,地上的走獸穴蟻也有,而其中最方便觀察、能頻繁見(jiàn)到、密度又極高的群體是螞蟻(圖1)。于是,意大利的學(xué)者Dorigo和Maniezzo等觀察了螞蟻的覓食行為,在上世紀(jì)90年代提出了蟻群系統(tǒng) (Ant System或Ant Colony System)。不同于飛鳥,螞蟻是通過(guò)一邊行路一邊釋放“信息素”的物質(zhì)(英文為:pheromone。通俗點(diǎn)講,是體味的一種)來(lái)形成群體覓食行為的。螞蟻會(huì)沿著“信息素”濃度高的路徑來(lái)行走,同時(shí)它走過(guò)的時(shí)候也會(huì)留下自己的追蹤“信息素”,進(jìn)一步強(qiáng)化了可能到達(dá)食物的最短路徑。同時(shí), “信息素”會(huì)隨時(shí)間的增長(zhǎng)而揮發(fā),以保證路徑搜索不易僵化,失去靈活性。通過(guò)信息素的反復(fù)增強(qiáng)和淡化過(guò)程,蟻群就能沿最短路徑到達(dá)食物了[3]。 蟻群和鳥群優(yōu)化算法是文獻(xiàn)中最經(jīng)典的兩個(gè)群體智能算法。事實(shí)上,非人智能體的群體行為有很強(qiáng)的多樣性,如果留意觀察各種群體的行為表現(xiàn),還能找到更多很有新意的群體智能算法。 舉例來(lái)說(shuō),美國(guó)德州奧斯丁議會(huì)大橋有群蝙蝠群。據(jù)估計(jì),橋下生存了150萬(wàn)只墨西哥無(wú)尾蝙蝠(圖1)。每到傍晚時(shí)分就會(huì)出洞,成群飛行去覓食,已是當(dāng)?shù)刈钬?fù)盛名的旅游景點(diǎn)。對(duì)飛行類群體智能行為感興趣、希望找到新算法的不妨去觀察觀察。海洋中的魚群也自有其特點(diǎn)。較小的魚偏好成團(tuán),形成比較大的形狀,如圖1。與飛鳥不同,研究表明,小魚愛(ài)成群的原因是較個(gè)體而言,魚群的體積要大得多,能夠讓潛在的捕食者誤以為是比它大的生物體,從而不敢冒然攻擊,也就讓小魚多了生存的機(jī)會(huì)。除了覓食和生存行為,遷徒行為也可以研究。比如大雁南飛時(shí)的,頭雁引航的人字形隊(duì)現(xiàn)象。在遷徒中,頭雁與其它從雁在決定路線方面的決策權(quán)方面顯然存在大的差異。 圖1:從上到下,從左到右:鳥群、蟻群、蝙蝠群、魚群 當(dāng)然,動(dòng)物的群體行為也并非始終優(yōu)于個(gè)體,常常是機(jī)會(huì)與風(fēng)險(xiǎn)并存。比如,蟻群靠追蹤“信息素”來(lái)覓食的行為就不是百分之百安全。假如有一只引路的工蟻碰巧離開(kāi)了有“信息素”的路徑,跟著它集體覓食的螞蟻都會(huì)離開(kāi)路徑,極端情況下會(huì)形成如圖2的螞蟻亂轉(zhuǎn)(Ant Mill)的循環(huán)圓圈,最終導(dǎo)致螞蟻因?yàn)轶w能耗盡而集體死亡。這是與群體優(yōu)勢(shì)相背的群體錯(cuò)覺(jué)。再比如小魚的魚群現(xiàn)象,有些捕食者就會(huì)故意利用這個(gè)習(xí)性。如殺人鯨(Killer Whale,也稱虎鯨)為了提高吃小魚的效率,會(huì)有意識(shí)地分散開(kāi)將小魚們圍起來(lái),驅(qū)使小魚被動(dòng)在包圍圈內(nèi)形成密集的魚群,然后虎鯨便會(huì)輪流沖入圈中飽餐一頓。這是不同智慧級(jí)別的群體智能的對(duì)決結(jié)果。 圖2 左:螞蟻亂轉(zhuǎn);右:虎鯨在學(xué)習(xí)捕食魚群技巧 不僅非人智能體存在值得研究的群體行為,微觀層面中也有。 二、微觀和非生命體的群體算法 在布朗運(yùn)動(dòng)的基礎(chǔ)上,科學(xué)家提出了模擬退火(Simulated Annealing)的智能算法。它模擬了金屬退火中的加溫過(guò)程、等溫過(guò)程和冷卻過(guò)程,通過(guò)增強(qiáng)和減弱隨機(jī)游走的分子的布朗運(yùn)動(dòng)強(qiáng)度(如圖3),使其最終形成有序的全局平衡或最優(yōu)解 [4]。 除了分子的群體行為外,科學(xué)家們也看好基因。因?yàn)樵谒惴▽用嫔?,進(jìn)行群體的“基因編輯”都是相當(dāng)安全且無(wú)倫理問(wèn)題的。進(jìn)化論告訴我們,基因的演化有三種模式:復(fù)制(reproduce)、交叉(crossover)和變異(mutation)。那么,如果要“編輯”出一個(gè)最優(yōu)的“基因”,我們完全可以讓成千上組“基因”通過(guò)這三種方式來(lái)實(shí)現(xiàn)優(yōu)勝劣汰,最終收斂到期望的解。不過(guò)需要注意的是,在演化過(guò)程中,復(fù)制是根本,變異只能偶爾為之。這種基于基因群體行為的方法被稱為遺傳算法(genetic algorithm)[5]。 不僅微粒和基因有群體行為,甚至毫無(wú)生命特征的鈔票,也有人觀察到了有趣的群體流通行為。2002年德國(guó)物理學(xué)家Dirk Brockmann發(fā)現(xiàn),盡管在絕大多數(shù)時(shí)間里,鈔票只在一個(gè)較小的區(qū)域里交換,但是仍有一小部分鈔票會(huì)流通到較遠(yuǎn)的地方,如圖3所示。他將這種流通模式被稱為列維飛行模式(Levy flight pattern),并認(rèn)為其流通性質(zhì)表明小概率的事件有時(shí)會(huì)產(chǎn)生較大的影響[6]。 圖3:布朗運(yùn)動(dòng)中的隨機(jī)游走與列維飛行模式 不論采用的是哪種方法,從本質(zhì)上都有一個(gè)隱含假設(shè)在其中。既認(rèn)為個(gè)體的活動(dòng)具有隨機(jī)性,但納入群體后,最終這種局部或個(gè)體的隨機(jī)性可以收斂到全局平衡有序的環(huán)境?;谶@一假設(shè),以上提及的非人智能群體智能、微觀群體算法和遺傳算法常被用于目標(biāo)的尋優(yōu),目的是為了幫助需要迭代求解或梯度尋優(yōu)的算法獲得最優(yōu)解。需要注意的是,由于這類算法或多或少都帶有比較強(qiáng)的啟發(fā)式,因此不太容易找到好的理論性證明,如數(shù)學(xué)家們偏好的存在性、收斂性和唯一性等以及統(tǒng)計(jì)學(xué)家偏好的泛化界。即使有一些理論性的證明,也只是在給了較多假設(shè)條件后的有限結(jié)論。盡管如此,這類方法在工程上仍然形成了不少好的應(yīng)用成果。 三、多樣性與集體學(xué)習(xí) 要發(fā)揮群體的優(yōu)勢(shì),關(guān)鍵是多樣性必不可少,因?yàn)椴町惔蟮臅r(shí)候更容易形成互補(bǔ)性。如蟻群算法中常假定每只螞蟻具有獨(dú)特的個(gè)性。不僅單個(gè)物種內(nèi)部有互補(bǔ)性,跨物種間也存在互補(bǔ)性,甚至更明顯。比如兩種能獨(dú)立生存的生物間的原始協(xié)作關(guān)系(Protocooperation),可以保證雙方都能獲利。圖4中寄居蟹與附著于寄居蟹匿居的貝殼上的???、鮣魚利用吸盤附著在鯊魚體表與鯊魚,都是這類原始協(xié)作關(guān)系。??柚木有?、鮣魚借助于鯊魚擴(kuò)大了活動(dòng)范圍和覓食機(jī)會(huì),反過(guò)來(lái)??王忯~又分別給寄居蟹和鮣魚提供了保護(hù)。還有對(duì)一方有利,對(duì)另一方無(wú)關(guān)緊要的偏利共生(Commensalism),如常受??Wo(hù)的雙鋸魚。人類與寵物狗的共生也比較有意思。人從寵物狗中得到了情感的慰籍,老年人甚至把它做為已自立門戶的子女的替代品。而寵物狗也不僅僅是得到食物,還從人類這里學(xué)習(xí)了很多人類的行為規(guī)范。值得再次強(qiáng)調(diào)的是,機(jī)器智能目前還無(wú)法替代寵物狗的共生功能。而在人工智能領(lǐng)域,也有不少研究是在學(xué)習(xí)和利用這種跨物種間的互補(bǔ)性,如利用地面機(jī)器人與無(wú)人機(jī)的互補(bǔ)性來(lái)實(shí)現(xiàn)對(duì)未知環(huán)境的快速探路。而2017年出臺(tái)的《新一代人工智能發(fā)展規(guī)劃》中,也強(qiáng)調(diào)了要著重研究“多人多機(jī)聯(lián)結(jié),使之涌現(xiàn)出更強(qiáng)大智能”的群體智能。 圖4: 左:寄居蟹與???;右:鮣魚與鯊魚 在通訊中也能見(jiàn)到利用多樣性和互補(bǔ)性的應(yīng)用。如在信道的誤差糾編中,為了保證信息在傳輸中不發(fā)生錯(cuò)誤,最簡(jiǎn)單的操作就是多傳輸幾次。盡管每一次都有可能出錯(cuò),但只要出錯(cuò)的位置不同,總能通過(guò)少數(shù)服從多數(shù)的方式來(lái)大幅度降低傳輸犯錯(cuò)的概率,最大程度地保證信號(hào)傳輸?shù)恼_性。 機(jī)器學(xué)習(xí)界把利用集體或群體來(lái)增強(qiáng)性能的策略叫做集成學(xué)習(xí) (Ensemble learning)。要在集成框架下獲得好的性能,基本假設(shè)是每個(gè)子體學(xué)習(xí)器要有一定的預(yù)測(cè)能力,比如至少要比扔硬幣隨機(jī)猜的性能好一點(diǎn),同時(shí)分類器之間要有足夠大的多樣性或差異性。在這一思想下,大量的集成學(xué)習(xí)方法被發(fā)展。以分類任務(wù)如人臉識(shí)別為例,早期端對(duì)端的深度學(xué)習(xí)還未流行時(shí),一般都從三個(gè)角度來(lái)實(shí)現(xiàn)群體的集成?;蚴歉淖冚斎氲奶卣?,形成多樣性;或是變更學(xué)習(xí)器的多樣性,或是動(dòng)最終輸出函數(shù)的集成方式[7]。雖然基本套路并不復(fù)雜,但俗話說(shuō)得好“三個(gè)臭皮匠抵個(gè)諸葛亮”。在 2012年深度學(xué)習(xí)沒(méi)有形成大的性能提升前,集成學(xué)習(xí)模型形成的群體優(yōu)勢(shì)幾乎是打遍了“所有與數(shù)據(jù)相關(guān)的競(jìng)賽”而無(wú)敵手。而2012年后,盡管深度學(xué)習(xí)成為主流,但仍然能見(jiàn)到集成學(xué)習(xí)的三板斧,有些是轉(zhuǎn)化成了深度學(xué)習(xí)中網(wǎng)絡(luò)的結(jié)構(gòu)變化,有些仍是通過(guò)把多個(gè)深度模型結(jié)合來(lái)繼續(xù)用群體優(yōu)勢(shì)拔得競(jìng)賽的頭籌。 圖5:三個(gè)臭皮匠頂個(gè)諸葛亮 如果分析以上這些群體智能學(xué)習(xí),不難發(fā)現(xiàn),這些群體算法要么是針對(duì)某個(gè)目標(biāo)的優(yōu)化來(lái)考慮的,要么是針對(duì)某個(gè)目標(biāo)的預(yù)測(cè)來(lái)實(shí)施的。研究非人智能體的群體算法時(shí),科學(xué)家們著重觀察的現(xiàn)象似乎主要與其群體的生存密切相關(guān)。反觀人類,在成了地球主宰后,早已不再僅僅滿足于生存需求,還衍生了生理、安全、社交、尊重和自我實(shí)現(xiàn)共五個(gè)層次的需求,被稱為馬斯洛需求層次理論。而這些高層次的需求在人工智能的學(xué)習(xí)中卻很少被涉及。 圖6:馬斯洛需求層次理論 如果要研究人工智能,必然要考慮人工智能體形成社會(huì)和群體、而非個(gè)體時(shí)的情況。那我們不妨看看,人類智能體在生存需求以上,群體生活時(shí)會(huì)存在哪些錯(cuò)覺(jué)。如果人工智能體希望模擬人的群體行為,也許就能從這些錯(cuò)覺(jué)中得到一些經(jīng)驗(yàn)的借鑒。 四、群體錯(cuò)覺(jué) 一旦有了社會(huì),生存需求就退居二線了。此時(shí)的群體不再滿足于以“預(yù)測(cè)”為終極目標(biāo)的,對(duì)知識(shí)的渴求會(huì)逐漸占上風(fēng),尤其是信息量大的知識(shí)。比如“太陽(yáng)從東邊升起”這種自然規(guī)則,按概率來(lái)說(shuō),就是百分之百能成立的。然而他卻是沒(méi)有知識(shí)含量的。因?yàn)?按信息論之父香農(nóng)的定義,信息是事件出現(xiàn)概率的倒數(shù)的負(fù)對(duì)數(shù)比。簡(jiǎn)單來(lái)說(shuō),百分之百出現(xiàn)的,信息等于0。對(duì)習(xí)慣快思維的人類來(lái)說(shuō),這類信息會(huì)和路面的細(xì)節(jié)一樣被直接忽略。如果事件出現(xiàn)的概率很小時(shí),反而蘊(yùn)含了大的信息量。比如馬路上突然有人打架,于是路人們會(huì)一擁而上,觀戰(zhàn)拿手機(jī)發(fā)朋友圈。這是信息論下“對(duì)知識(shí)的渴求”表現(xiàn)出來(lái)的群體本能反應(yīng)。 可是假如不是打架,而是刑事事件時(shí),旁觀者愿意主動(dòng)施救的反而可能變少,尤其是在人來(lái)人往的場(chǎng)所。這是因?yàn)楫?dāng)在場(chǎng)的人太多時(shí),幫助的責(zé)任就被大家平分,平分到連旁觀者都意識(shí)不到,以至于給人造成了“集體冷漠”的感覺(jué)。這不是信息量在起作用,而是責(zé)任分散效應(yīng)的群體錯(cuò)覺(jué)。我國(guó)的“三個(gè)和尚”故事中講的“一個(gè)和尚挑水喝,兩個(gè)和尚抬水喝,三個(gè)和尚沒(méi)水喝”,就是責(zé)任分散效應(yīng)的體現(xiàn)。 也有人期望通過(guò)群體的力量獲得集成學(xué)習(xí)般的性能提升。然而,“物以類聚、人以群分”,即使現(xiàn)代社會(huì)也是如此,如朋友圈中的五花八門的群,常是因某一方面的共性而形成的群體。在這種群體時(shí),執(zhí)異見(jiàn)的更容易被孤立而非接納。不僅群體有排斥現(xiàn)象,甚至有時(shí)還會(huì)有智商、情商的拉低效應(yīng)。比如如果參加傳銷團(tuán)體,人會(huì)不由自主失去自我意識(shí),導(dǎo)致本應(yīng)正常的智商無(wú)法表現(xiàn),變成智力水平低下的生物。這些現(xiàn)象是群體的拉平錯(cuò)覺(jué)[1]。 群體智能在少數(shù)服從多數(shù)問(wèn)題上也存在誤區(qū)。因?yàn)槿后w經(jīng)常表現(xiàn)的是普通品質(zhì),并不能勝任需要很高智力才能完成的工作[1],但卻可能因這一規(guī)則而扼殺智慧。比如在早期科學(xué)還處在啟蒙階段時(shí),哥白尼因堅(jiān)持日心說(shuō)而被教會(huì)燒死,而伽利略為了保全性命不得不犧牲掉自己對(duì)這一觀點(diǎn)堅(jiān)持。這些都表明多數(shù)投票策略可能存在的風(fēng)險(xiǎn),因?yàn)檎胬聿⒁欢ǘ颊莆赵诙鄶?shù)人手里的。這是統(tǒng)計(jì)中在缺乏先驗(yàn)信息時(shí),采用群體平均權(quán)重引發(fā)的錯(cuò)覺(jué)。 這也反映了另一個(gè)現(xiàn)象,在群體社會(huì)中,成群并非對(duì)所有人都是最優(yōu)的,因?yàn)?/span>“牛羊才會(huì)成群,獅虎只會(huì)獨(dú)行”。 畢淑敏說(shuō)過(guò)“孤獨(dú)是一種獸性”。它反映了獨(dú)來(lái)獨(dú)往的自信和勇猛。適當(dāng)享受個(gè)體的孤獨(dú),還能更有效的管理時(shí)間和自由的探索。 群體錯(cuò)覺(jué)還有不少,它間接或直接地導(dǎo)致了社會(huì)的多樣性和層次性。這些是我們?cè)谘芯咳斯ぶ悄苋后w行為時(shí)需要注意的,也是人工智能體未來(lái)形成人工智能社會(huì)時(shí)需要考慮的。 到此為止,我已經(jīng)從諸多層面介紹了人類的錯(cuò)覺(jué)。我們不禁要問(wèn),人類如此愛(ài)犯錯(cuò),為什么還能主宰世界呢?機(jī)器智能會(huì)替代人類成為主宰嗎? 參考文獻(xiàn): 1、古斯塔夫·勒龐 著,馮克利 譯. 烏合之眾:大眾心理研究. 中央編譯出版社,2005. 2、Kennedy, J., Eberhart, R. Particle swarm optimization. In: Proceedings of the IEEE International Conference on Neural Networks. 4: 1942–1948, 1995. 3、Dorigo, M., Maniezzo, V., Colorni A. Ant system: optimization by a colony of cooperating agents. IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), 6(1), pp: 29-41, 1996. 4、Kirkpatrick, S., Gelatt Jr, C. D., Vecchi, M. P. Optimization by Simulated Annealing. Science. 220 (4598): 671–680, 1983. 5、https://en./wiki/Genetic_algorithm 6、Brockmann, D., Sokolov, IM. Lévy flights in external force fields: from models to equations. Chemical Physics 284 (1-2), 409-421, 2002. 7、Zhou Z.-H. Ensemble Methods: Foundations and Algorithms. CRC Press. Jun 6, 2012. 張軍平 2018年12月7日 文章來(lái)源:張軍平 |
|
來(lái)自: 親斤彳正禾呈 > 《科創(chuàng)》