【remind的回答(18票)】: 這個問題很有趣,我就不請自來了。讓我先定義清楚概念,然后給出我的回答,最后給解釋。 1. 定義:個體理性,集體最優(yōu),納什均衡,集體混亂 本答案的所有定義和討論都是在博弈論下進行的,即對于每一個要分析的情景,都由這三個要素構(gòu)成:a. 行動個體, b.每個個體的可選行為的集合,和c. 每個個體的定義在所有人的選擇結(jié)果上的效用函數(shù)。
其次,我們是按照經(jīng)濟學的范式來定義個體理性的,即效用最大化行為。請注意這里已經(jīng)把人們可能存在利他等偏好的情況也包含進來了,因為一個人的效用也可以是其他人的收益的函數(shù)。所以按此定義,存在利他等偏好并非不理性。 2. 回答 (1)幾乎在任何情況(game)下,人們的行為都會收斂到一個納什均衡(Friedman, 1953; Young,1993;Vega-Redondo, 1996)。這意味著: a. 給定一個情景,如果該情景下的集體最優(yōu)不是一個納什均衡,那這個集體最優(yōu)幾乎無論如何都是達不到的,無論個體是理性還是非理性,無論有沒有外部權(quán)威(政府)的協(xié)調(diào)(除非他改變了這個game)。 b. 雖然個體理性和非理性都不能保證集體最優(yōu),但往往能避免最壞的集體混亂的情況發(fā)生,即就算沒有任何外部權(quán)威(如政府)的協(xié)調(diào),社會秩序也能自發(fā)形成(Sugden, 1986)。 (2)當存在多個均衡,并且有些均衡有效率有些沒有效率時,相比起所有人都百分百理性(不會犯錯)而言,有時候一定程度的個體非理性(偶爾犯錯)反而會達致集體最優(yōu)的那個均衡,即使沒有任何外部權(quán)威的協(xié)調(diào)(Young,1993, 1998)。 3. 解釋 ……先占個坑,有空再繼續(xù)碼…… References: Friedman, M. (1953). The methodology of positive economics. Sugden, R. (1986). The economics of rights, co-operation and welfare (Vol. 22). Oxford: Basil Blackwell. Vega-Redondo, F. (1996). Evolution, games, and economic behaviour. Oxford University Press. Young, H. Peyton. "The evolution of conventions." Econometrica: Journal of the Econometric Society (1993): 57-84. Young, H. P. (2001). Individual strategy and social structure: An evolutionary theory of institutions. Princeton University Press. 【zhaowei的回答(7票)】: 從合作博弈的角度來考慮:如果把“集體理性”的各種不同的理解作為某solution concept的公理,就要對其他公理和希望有的solution concept的性質(zhì)進行取舍。 比如我們可以認為對于一個合作博弈 ![]() ,Shapley value是一個滿足“集體理性”的solution concept,因為它要求efficiency axiom,所有參與者分配的收入總和等于他們可以達到的最大的收入總和: ![]() 。但問題是我們會問,為什么只有g(shù)rand coalition才算做集體?一些參與者也許希望把其他人排除在外,組成一個“小團體”,這不也是“集體理性”的一種理解嗎?一些博弈,比如沒有一票否決權(quán)的選舉博弈,不管怎么分配收入,總有人會想組成新的“小團體”,也就是empty core。 為此,我們可以放棄“集體理性”的假設(shè),最終達成的分配方案的分配方案不一定要滿足在Pareto surface上,也因此更沒必要為empty core,或者Shapley value不在core內(nèi)而困擾。這是Dubey, Neyman, and Weber(1981)的semivalue的思路。 我們也可以認為,我們模型中的參與者和我們一樣明白對“集體理性”要求那么強是做不到的,所以會克制,或者限制自己為了更高的收入,不斷地要求組成新的coalition的做法。畢竟,這樣周而復始的改變分配方案現(xiàn)實中對誰都不利(情感關(guān)系中這種例子不要太多了)。我們可以把這種追求coalition的收益最大化的動機,限制在某些coalition內(nèi)。比如某個集合 ![]() 內(nèi)的參與者的能力只能幫助到這個集合以內(nèi)的人,也就是對 ![]() 內(nèi)的人沒有外部性,我們可以要求最終的給予 ![]() 的分配的收入總和應(yīng)該至少等于 ![]() 。也就是只要求 ![]() 這樣的集體具有“集體理性”。而這就是Kalai and Samet(1987)的 weighted Shapley value的刻畫條件之一。 【MORISEFENG的回答(23票)】: ![]() 以上是經(jīng)典的MWG對理性偏好的定義。以上是經(jīng)典的MWG對理性偏好的定義。 我們按照這個定義來講。很容易構(gòu)建一個個體的理性但群體非理性的行為。 例如共有3個人(1、2、3)和3個商品(a、b、c)。(下邊用>來表示偏好關(guān)系) 1:a>b;b>c;a>c 2:b>c;c>a;b>a 3:c>a;a>b;c>b 可以發(fā)現(xiàn)這三個人都滿足完備性和傳遞性。因為他們每個人都對abc做出了偏好的判斷,且判斷滿足傳遞性。 那么理性的個體所導出的群體偏好也滿足這兩條嗎?問題在于如何通過個體導出“社會”的偏好。一個最簡單的方式是民主,也就是按照多數(shù)人的偏好來決定社會偏好。 那么 對于a和b,由于1和3都認為a>b,所以社會也會認為a>b 對于b和c,由于1和2都認為b>c,所以社會也會認為b>c 對于c和a,由于2和3都認為c>a,所以社會也會認為c>a 這里的社會偏好仍然滿足完備性。但是不滿足傳遞性,因為根據(jù)傳遞性,a>b和b>c意味著a>c,然而社會偏好則認為c>a。 所以這里通過民主達到的社會偏好就不是理性的。 【吳致霆的回答(13票)】: 那么反問題主,如何定義「群體非理性」呢? 比如 @Ivony提到的囚徒困境,為什么囚徒困境是群體非理性呢?因為沒有達到最優(yōu)的結(jié)果么? 如果定義「群體的行為沒有達到最優(yōu)結(jié)果就是群體非理性」,那么仔細想一想,從委托代理問題到公共物品問題,到外部性問題,都是群體非理性?如果是這樣,同樣由于信息不對稱帶來的信貸周期算不算群體非理性? 個人的rationality是有定義的,我們可以很容易的進行討論。但是群體非理性?定義是啥? 至少我沒看過類似的文獻定義了群體的理性。只能求大神科普文獻了 【黃若林的回答(22票)】: 當然會, 最典型的不就是囚徒困境么? 【活屠匪的回答(4票)】: 團購啊,以飯店為例說明。 現(xiàn)在飯店的效益普遍不好,至少媒體是這么說,并且歸因于反腐倡廉,這可真會給自己臉上貼金。其實根本原因是團購的大發(fā)展,導致菜品質(zhì)量和價格透明度提高,利潤率自然大跳水。 剛開始一些新開張的,還有一些位置不太好上座率不高的飯店被團購網(wǎng)輕松攻陷,畢竟房租水電和服務(wù)員薪水這些(固定成本)無論客人多少都不能拖欠的,上團購網(wǎng)打些折扣薄利多銷(攤薄固定成本)是有賺頭的。 但是當原本生意興隆的飯店被團購網(wǎng)上的同行搶光了客人,不得不加入團購網(wǎng)之后情況就比較有戲劇性了,這就像劇場里有人踮起腳尖,那他身后的人只能跟隨,最后所有人都踮起腳尖,該看不到的還是看不到,但每個人卻都比原來更累。 【夏川至的回答(4票)】: 這不是索羅斯的反身性理論嗎。 其實這個問題取決于信息。 囚徒困境為什么是困境?因為他們不能互相交流。 泡沫為什么能瘋狂膨脹起來?人們都不覺得自己是最后一棒。 像檸檬市場,二手車市場,也是因為人們難以對商品的真實情況有所了解。 總結(jié)一下,這類問題的本質(zhì)不是每個個體的不理性導致群體非理性,而是在不充分的信息下做出的理性行為,不見得是理性的。 【噠噠噠的回答(4票)】: Information Cascade (信息小瀑布?):一群人依次獨立地獲取信息,每個人根據(jù)前人的行為和自己的信息做出理性決定,結(jié)果可能所有人的行為都不是最優(yōu)的。 舉個栗子,一個箱子里裝了很多紅栗子和黑栗子,我們需要判斷出紅栗子多還是黑栗子多。如果我自己一個人不停地抓栗子,那么抓的個數(shù)越多,抓出紅(黑)栗子的比例越接近箱子里紅(黑)栗子的比例,我就能越來越準確地判斷出紅栗子多還是黑栗子多。 但是當一群人依次摸栗子…… 第一個人摸了個紅的,他說:“我猜紅的多!” 很科學。 第二個人又摸了個紅的,他想:“第一個人猜紅的,那他肯定摸了紅的,我這又摸了紅的,當然猜紅的多?!?科學。 第三個人摸了黑的,他看前兩個人都猜紅的,心想:“第一個人肯定摸了紅的,第二個人如果摸了黑的,就會選黑的(假設(shè)每個人判斷紅黑出現(xiàn)個數(shù)一樣時,優(yōu)先猜自己摸的顏色)。既然他也選了紅的,肯定也是摸了紅的。我這才一個黑的,我也猜紅的!” 科學。 第四個人知道第三個人不管摸著啥都會選紅的,所以第三個人的行為不能提供任何信息。于是第四個人和第三個人面對的情況一樣,還是選紅的??茖W。 ……所有人都選了紅的。 事實上只要出現(xiàn)相鄰的兩個人猜了同樣的顏色,后面所有人都會猜這個顏色。一點點信息就決定了所有人的行為。 這個模型可以解釋各種跟風隨大流的行為,而且是“理性”的。 【知之為知之的回答(1票)】: 再次po出我的答案: 本答案來自: 為什么大學上課的時候很多人不愿意坐前排?反映了什么心理? - ruiz Posi 的回答 答案正文: 我想以一種動態(tài)的視角來回答這個問題,因為我經(jīng)歷過這種場景而且自己琢磨過這個問題。下面是我的一個思考。 由研一上學期馬哲課座位選擇行為引出的思考 一、背景 研一上學期有一門馬哲課,記不清具體名字了。這種課大家都懂得,如果老師沒有很強的人格魅力是不可能吸引大家去認真聽課的,于是我就觀察了一下一學期以來同學們上課時座位在教室位置的動態(tài)變化,做了一個小的建模,對動態(tài)行為演進過程簡單的擬合。 二、現(xiàn)象分析: 1、現(xiàn)象: 教室是大的階梯教室,大約能座200人的樣子,而我們上課的人數(shù)本來也應(yīng)該是這個數(shù),但是由于逃課現(xiàn)象太猖獗,真正去上課的不到100人,頂多有50—60人,所以教室是坐不滿的。那么學期一開始人比較多,大家也都會往前座,但是隨著時間的推移,整體就開始逐漸往后移動,最后全部都聚集到最后幾排。 中間老師也警告大家不要往后坐,并且又一次特別生氣,強制大家全都挪到前幾排,但是隨著時間的推移,大家的位置還是逐漸的向后排移動了。 2、分析: 根據(jù)自身體會以及同學們的交流,感覺同學們不是不喜歡坐前面,而是不喜歡坐在別人前面。換句話說,坐在教室前面可以,但是希望前面有人坐著,這樣比較有安全感?;蛘呤沁@樣一種心理,不喜歡不合群,也就是大家都坐在后面的時候不想自己太突兀的坐在前面。 我想到本科學的謝識羽的《經(jīng)濟博弈論》中的一個模型:大規(guī)模有限理性群體復制動態(tài)博弈。于是嘗試構(gòu)建這樣的模型來擬合這種行為。 三、理論模型 簡單介紹一下這個模型,大規(guī)模有限理性群體復制動態(tài)博弈。 1、大規(guī)模:就是說博弈參與者是處于一個較大的群體之中的,而且個體的效用與總體狀態(tài)有關(guān)。 2、隨機配對:個體在一個群體中,與多個個體進行博弈,博弈對象的挑選是隨機配對的,這一點是將宏觀群體現(xiàn)象落實到微觀決策行為的關(guān)鍵。 3、有限理性:參與者是有限理性的,不能再一次博弈中就達到最優(yōu)狀態(tài),所以參與者會隨著博弈結(jié)果不斷調(diào)整自己的行為,或者這是一種學習過程。 4、復制:也就是參與者的動態(tài)學習、調(diào)整個人行為的過程。 5、動態(tài)博弈:是一個多階段博弈,但是這個階段并非是離散階段,是連續(xù)的。 四、假設(shè)與模型構(gòu)建 1、個體隨機配對博弈的收益矩陣: 我們做這樣的假設(shè),群體中的兩個博弈參與者是這樣的: (首先說明,下面說的兩人的決策——坐前面或者坐后面并不是說教室中某些具體的位置,而是以一個相對宏觀的視角來看,實在教室的偏前還是偏后) (1)如果兩個人都坐在前面,則兩個人收益都是0.5,因為這樣相對安全而且老師不會生氣,而且可以多多少少聽進去老師說的東西(假設(shè)有點用); (2)如果兩個人一個在前面一個在后面,那么在前面的收益是0,在后面的收益是1,因為這樣在前面的參與者感覺沒有安全感,受到約束過多,而在后面的參與者心理上有安全感,進可攻(聽課)退可守(玩手機)。 (3)如果兩個人都坐在后面,則收益均為0,這是因為都在后面的話,參與者會擔心會引起老師的反感甚至生氣,老師會挑后排的同學站起來回答問題。 那么收益矩陣是這樣的: ![]() 在靜態(tài)博弈中最終的均衡是一前一后,也即(前,后)或(后,前),然而在動態(tài)過程中卻是另一種考量。 2、期望收益的計算: 假設(shè)群體中某一時間選擇策略:坐在后面 的比例為x(x在0到100%之間),那么選擇策略:坐在前面的比例為1-x; (1)選擇策略坐在前面的參與者的期望收益: UF=0.5*(1-x)+0*x=0.5*(1-x)。 基于大群體內(nèi)隨機配對的假定,因為他有1-x的概率會碰到選擇坐前面的博弈對手,這樣他的收益為0.5;有x的概率碰到選擇坐后面的博弈對手,這樣他的收益為0。所以期望收益為UF=0.5*(1-x)+0*x。 (2)選擇策略坐在后面的參與者的期望收益: UB=1*(1-x)+0*x=1-x。 因為他有1-x的概率會碰到選擇坐前面的博弈對手,這樣他的收益為1;有x的概率碰到選擇坐后面的博弈對手,這樣他的收益為0。 (3)整個群體平均期望收益: Uav=x* UB+(1-x)* UF=0.5*(1-x^2) (4)選擇坐在后面參與者的期望收益超過群體平均期望收益的幅度: UB-Uav=1-x-0.5*(1-x^2)=0.5*(1-x)^2 3、動態(tài)微分方程 我們再來考察選擇策略坐后面的參與者占比(x)隨時間的動態(tài)變化,也就是: 我們根據(jù)此模型的理論,它與兩個因素相關(guān): (1)與坐在后面的人所占比例x正相關(guān)。因為坐在后面的人占比越高,選擇坐后面的人增加的速度越快; (2)與選擇坐在后面參與者的期望收益超過群體平均期望收益的幅度(UB-Uav)正相關(guān)。因為選擇坐后面比平均水平獲得收益越多,那么選擇坐后面就越有吸引力,選擇坐后面占比增加的越快。 那么我們令: ![]() =x*( UB-Uav)=0.5*x*(1-x)^2 畫出圖像: ![]() 注:圖中那條直線是做的0點處的切線。 4、均衡分析 根據(jù)上圖, ![]() 有兩個點同x軸相交,也就是說與x軸交點處,x不再隨著時間變化,也即達到均衡。所以此過程有兩個均衡點,也就是0和1然而只有一個——1處是穩(wěn)定的。 (1)x=1處是一個穩(wěn)定均衡點,因為即使有隨機擾動使得x偏離了1,也即比1小一點點,那么 ![]() 就會大于0,也就是說x會隨著時間的推移增加,最后還是會回到1點。這一點就叫進化穩(wěn)定策略(evolutionarily stable strategy,ESS)。 (2)x=0處是一個不穩(wěn)定的均衡點。圖中的直線是0處的切線,我們知道動態(tài)微分方程中一點斜率只有為負才算穩(wěn)定的均衡點,0點處切線斜率為正,顯然不是穩(wěn)定的均衡。它的不穩(wěn)定體現(xiàn)在,一旦有隨機擾動偏離0點,那么 ![]() 就會大于0,也就是說x會隨著時間的推移增加,逐漸向1點靠近,最后還是在1點達到穩(wěn)定均衡。 五、結(jié)論 所以根據(jù)以上分析,最后的結(jié)果是x=1是穩(wěn)定均衡,也就是大家全都選擇策略坐在后面,這就在一定程度上解釋了教室里所發(fā)生的現(xiàn)象。而當老師強制大家坐在前面時,也許當時大家都過去了,到了下次上課,由于有些膽子大的“隨機擾動項”嘗試向后坐,導致群體偏離不穩(wěn)定均衡0點,而后又發(fā)生了逐漸向后移的過程。 六、其他副產(chǎn)品 下面說三個在主體模型之外的我想到的一些現(xiàn)象: 1、謝林分隔模型(Schelling Segregation Model)。這種分隔現(xiàn)象也在教師中有所體現(xiàn)。大家基本是男生跟女生是扎堆坐的,也就是性別相同的坐在一起,而不是混著坐,即使混著坐集體的效用更高。 ![]() 2、信息瀑流(Information Cascade)。從社會網(wǎng)絡(luò)分析中學的一個術(shù)語。后面的人的行為并非出于自身效用最大化而是根據(jù)前面人的行為進行自己的決策。其實這只是一種微觀視角,其實本質(zhì)上還是在我上面的大規(guī)模有限理性群體復制動態(tài)博弈的參與者的一種決策形式。 3、信息在群體中的傳播(dissemination of information)。曾經(jīng)上課有這么一個小插曲,又一次我跟同學F去上課,當時大家的位置已經(jīng)處于最后幾排的位置,但是當我們?nèi)サ臅r候大家都集中在除了最后一排的最后幾排,也就是說最后一排除了我倆還有個別同學,于是我倆在那嘀咕:會不會是老師說這節(jié)課要專門提問最后一排的同學啊。結(jié)果我倆就往前挪了,結(jié)果最后一排的同學看我們走了,也往前挪了,雖然后面有同學陸續(xù)進教室,但是都不敢坐最后一排,因為不知聽誰說老師這節(jié)課讓最后一排的回答問題。這就涉及群體傳播學和心理學的一些問題,我暫時不太明白,希望有感興趣的一起探討。 七、思考 也許大家認為這是發(fā)生在教室里的小屁孩那點破事不值得這么復雜的分析。其實這只是現(xiàn)實世界人類群體行為的一個縮影。個體的看似理性選擇,最終卻導致群體非理性的結(jié)果。這樣的例子還用我來一一列舉嗎? 【阿昕學長的回答(1票)】: 如果我們都是純理性人,那么人類早滅亡了,我們歌頌英雄,崇拜榮譽,本身就是在激勵那些有利于整體而對個體非理性的行為。 |
|