博弈論的基本概念 博弈要素:
(1)決策人:在博弈中率先作出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。
(2) 對抗者:在博弈二人對局中行動滯后的那個人,與決策人要作出基本反面的決定,并且他的動作是滯后的、默認(rèn)的、被動的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇,占去空間特性,因此對抗是唯一占優(yōu)的方式,實為領(lǐng)導(dǎo)人的階段性終結(jié)行為。
(3)
局中人(players):在一場競賽或博弈中,每一個有決策權(quán)的參與者成為一個局中人。只有兩個局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個局中人的博弈稱為 “多人博弈”。
(4)策略(strategies):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導(dǎo)整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。
(5)得失(payoffs):一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié)束時的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。
(6)次序(orders):各博弈方的決策有先后之分,且一個博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。
(7)博弈涉及到均衡:均衡是平衡的意思,在經(jīng)濟(jì)學(xué)中,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中,某一
商品市場如果在某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達(dá)到了均衡。所謂納什均衡,它是一穩(wěn)定的博弈結(jié)果。
納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當(dāng)其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。在
納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。納什均衡點存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人
零和博弈中,當(dāng)局中人A采取其最優(yōu)策略a*,局中人B也采取其最優(yōu)策略b*,如果局中人B仍采取b*,而局中人A卻采取另一種策略a,那么局中人A的支付不會超過他采取原來的策略a*的支付。這一結(jié)果對局中人B亦是如此。
這樣,“均衡偶”的明確定義為:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱之為均衡偶,對任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(a, b*)≤偶對(a*,b*)≥偶對(a*,b)。
對于
非零和博弈也有如下定義:一對策略a*(屬于策略集A)和策略b*(屬于策略集B)稱為非零和博弈的均衡偶,對任一策略a(屬于策略集A)和策略 b(屬于策略集B),總有:對局中人A的偶對(a, b*) ≤偶對(a*,b*);對局中人B的偶對(a*,b)≤偶對(a*,b*)。
有了上述定義,就立即得到
納什定理:
任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。
納什定理的嚴(yán)格證明要用到不動點理論,不動點理論是
經(jīng)濟(jì)均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價于找到博弈的不動點。
納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果。
但納什均衡點定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結(jié)論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點”。
塞爾頓(R·Selten)在多個均衡中剔除一些按照一定規(guī)則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。
夏普里值
考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權(quán)力,規(guī)則規(guī)定,當(dāng)超過50%的票認(rèn)可了某種方案時才能通過。那么如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……
權(quán)力指數(shù):每個決策者在決策時的權(quán)力體現(xiàn)在他在形成的獲勝聯(lián)盟中的“關(guān)鍵加入者”的個數(shù),這個“關(guān)鍵加入者”的個數(shù)就被稱為權(quán)利指數(shù)。
夏普里值(
Shapley value):在各種可能的聯(lián)盟次序下,參與者對聯(lián)盟的邊際貢獻(xiàn)之和除以各種可能的聯(lián)盟組合。
次序 abc acb bac bca cab cba
關(guān)鍵加入者 b c a a a a
由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6
所以a,b,c應(yīng)分別獲得100萬的2/3,1/6,1/6
智豬博弈
智豬博弈(
Pigs’payoffs)講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。
如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。
改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會有踩踏板的動力了。
如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個游戲規(guī)則的設(shè)計顯然是失敗的。
改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。
對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?
改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費完。
對于游戲設(shè)計者,這是一個最好的方案。成本不高,但收獲最大。
原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。
比如,公司的激勵制度設(shè)計,獎勵力度太大,又是持股,又是期權(quán),公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵
機制設(shè)計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實現(xiàn)有效的激勵。
許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個中道理。
博弈的分類根據(jù)不同的基準(zhǔn)也有不同的分類。一般認(rèn)為,博弈主要可以分為
合作博弈和非合作博弈。 合作博弈和非合作博弈的區(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒有一個具有約束力的協(xié)議,如果有,就是合作博弈,如果沒有,就是非合作博弈。
從行為的時間序列性,博弈論進(jìn)一步分為靜態(tài)博弈、
動態(tài)博弈兩類: 靜態(tài)博弈是指在博弈中,參與人同時選擇或雖非同時選擇但后行動者并不知道先行動者采取了什么具體行動;
動態(tài)博弈是指在博弈中,參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動。通俗的理解:"囚徒困境"就是同時決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動有先后次序的,屬于動態(tài)博弈
按照參與人對其他參與人的了解程度分為
完全信息博弈和
不完全信息博弈?!⊥耆┺氖侵冈诓┺倪^程中,每一位參與人對其他參與人的特征、
策略空間及收益函數(shù)有準(zhǔn)確的信息。
不完全信息博弈是指如果參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。
目前經(jīng)濟(jì)學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于
合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論。非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動態(tài)博弈。與上述四種博弈相對應(yīng)的均衡概念為:納什均衡(Nash equilibrium),
子博弈精煉納什均衡(subgame perfect Nash equilibrium),
貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。
博弈論還有很多分類,比如:以博弈進(jìn)行的次數(shù)或者持續(xù)長短可以分為有限博弈和無限博弈;以表現(xiàn)形式也可以分為一般型(戰(zhàn)略型)或者展開型,等等。
博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會經(jīng)濟(jì)現(xiàn)象的學(xué)科一樣,都是從復(fù)雜的現(xiàn)象中抽象出基本的元素,對這些元素構(gòu)成的數(shù)學(xué)模型進(jìn)行分析,而后逐步引入對其形勢產(chǎn)影響的其他因素,從而分析其結(jié)果。
基于不同抽象水平,形成三種博弈表述方式,標(biāo)準(zhǔn)型、擴展型和特征函數(shù)型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為“社會科學(xué)的數(shù)學(xué)”從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經(jīng)濟(jì)學(xué)、政治學(xué)、社會學(xué)等等,被各門社會科學(xué)所應(yīng)用。
博弈論是指某個個人或是組織,面對一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實施,并從各自取得相應(yīng)結(jié)果或收益的過程,在經(jīng)濟(jì)學(xué)上博弈論是個非常重要的理論概念。
什么是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數(shù)中理性化、
邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個體如何在錯綜復(fù)雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數(shù)學(xué)家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規(guī)律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設(shè)雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時候,為了贏棋,得仔細(xì)考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當(dāng)然也知道甲想到了他在想甲的想法…
面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現(xiàn)實歸納的抽象數(shù)學(xué)問題求出最優(yōu)解、從而為在理論上指導(dǎo)實踐提供可能性呢?現(xiàn)代博弈理論由匈牙利大數(shù)學(xué)家馮·
諾伊曼于20世紀(jì)20年代開始創(chuàng)立,1944年他與經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟(jì)行為》,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。對于非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,凈獲利為零。在這里抽象化后的博弈問題是,已知參與者集合(兩方),策略集合(所有棋著),和盈利集合(贏子輸子),能否且如何找到一個理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優(yōu)的具體策略?怎樣才是“合理” ?應(yīng)用傳統(tǒng)決定論中的“最小最大” 準(zhǔn)則,即博弈的每一方都假設(shè)對方的所有功略的根本目的是使自己最大程度地失利,并據(jù)此最優(yōu)化自己的對策,諾伊曼從數(shù)學(xué)上證明,通過一定的線性運算,對于每一個二人零和博弈,都能夠找到一個“最小最大解” 。通過一定的線性運算,競爭雙方以概率分布的形式隨機使用某套最優(yōu)策略中的各個步驟,就可以最終達(dá)到彼此盈利最大且相當(dāng)。當(dāng)然,其隱含的意義在于,這套最優(yōu)策略并不依賴于對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現(xiàn)的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。
博弈論不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟(jì)學(xué)中占據(jù)越來越重要的地位,但如果你認(rèn)為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。實際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析
包羅·薩繆爾遜
方法和全新的思想。
諾貝爾經(jīng)濟(jì)學(xué)獎獲得者包羅·薩繆爾遜如是說:
要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。
也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
編輯本段應(yīng)用舉例
納什均衡
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。
1944年馮·諾依曼與奧斯卡·摩根斯特恩合著的巨作《博弈論與經(jīng)濟(jì)行為》出版,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。盡管對具有博弈性質(zhì)的問題的研究可以追溯到19世紀(jì)甚至更早。例如,1838年古諾(
Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產(chǎn)量與價格壟斷;2000多年前中國著名軍事家孫武的后代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不系統(tǒng)。馮·諾依曼和摩根斯特恩的《博弈論與經(jīng)濟(jì)行為》一書中提出的標(biāo)準(zhǔn)型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。合作型博弈在20世紀(jì)50年代達(dá)到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有限。正是在這個時候,非合作博弈———“納什均衡”應(yīng)運而生了,它標(biāo)志著博弈論的新時代的開始!納什不是一個按部就班的學(xué)生,他經(jīng)常曠課。據(jù)他的同學(xué)們回憶,他們根本想不起來曾經(jīng)什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數(shù)拓?fù)鋵W(xué)。斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾次課,納什就認(rèn)定這門課不符合他的口味。于是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個分支,如拓?fù)鋵W(xué)、代數(shù)幾何學(xué)、邏輯學(xué)、博弈論等等,深深地為之著迷。納什經(jīng)常顯示出他與眾不同的自信和自負(fù),充滿咄咄逼人的學(xué)術(shù)野心。1950年整個夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感!這一年的10月,他驟感才思潮涌,妙筆生花。其中一個最耀眼的亮點就是日后被稱之為“納什均衡”的非合作博弈均衡的概念。納什的主要學(xué)術(shù)貢獻(xiàn)體現(xiàn)在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合作博弈”的長篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之后,他遇到蓋爾,告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”(
minimax solution)推到非合作博弈領(lǐng)域,找到了普遍化的方法和均衡點。蓋爾聽得很認(rèn)真,他終于意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現(xiàn)實的情況,而對其嚴(yán)密優(yōu)美的數(shù)學(xué)證明極為贊嘆。蓋爾建議他馬上整理出來發(fā)表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這么做。結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。納什寫的文章不多,就那么幾篇,但已經(jīng)足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內(nèi)提一個教授,要求在“核心的刊物”上發(fā)表多少篇文章。按照這個標(biāo)準(zhǔn)可能納什還不一定夠資格。
1996年諾貝爾經(jīng)濟(jì)學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟(jì)學(xué)講座教授時也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學(xué)時就開始從事純數(shù)學(xué)的博弈論研究,1948年進(jìn)入普林斯頓大學(xué)后更是如魚得水。20歲出頭已成為聞名世界的數(shù)學(xué)家。特別是在經(jīng)濟(jì)博弈論領(lǐng)域,他做出了劃時代的貢獻(xiàn),是繼馮·諾依曼之后最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。后續(xù)的研究者對博弈論的貢獻(xiàn),都是建立在這一概念之上的。由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、
管理學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。
囚徒困境
在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(
prisoners’ dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪,各被判刑8年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個博弈的
支付矩陣。
表2.2 囚徒困境博弈 [Prisoner's dilemma]
A╲B |
坦白 |
抵賴 |
坦白 |
-8,-8 |
0,-10 |
抵賴 |
-10,0 |
-1,-1 |
我們來看看這個博弈可預(yù)測的均衡是什么。對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對稱性,B也會選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是
帕累托最優(yōu)的,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡。
要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問題?,F(xiàn)在幾乎所有的博弈論教科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。
博弈論畢竟是數(shù)學(xué),更確切地說是運籌學(xué)的一個分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟(jì)生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點玄奧,實際上卻具有重要現(xiàn)實意義。博弈論大師看經(jīng)濟(jì)社會問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監(jiān)禁———3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。不妨讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在《國富論》中的名言:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進(jìn)社會利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個
悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了
西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會、政治、國防、管理和日常
生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價格戰(zhàn)、軍備競賽、污染等等。一般的博弈問題由三個要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。
價格戰(zhàn)博弈
現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費者。每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn),百姓都會“沒事兒偷著樂”。在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個“納什均衡”。這個結(jié)果可能對消費者是有利的,但對廠商而言是災(zāi)難性的。所以,價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。二是如果不采取價格戰(zhàn),作為一種敵對博弈論(rivalry game)其結(jié)果會如何呢?每一個企業(yè),都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點,我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎(chǔ)上”。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進(jìn)行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格等于邊際成本。在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟(jì)效率狀態(tài)。如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟(jì)效率就會遭到破壞。這就是為什么WTO和各國政府要加強反壟斷的意義所在。
污染博弈
假如市場經(jīng)濟(jì)中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。按照看不見的手的原理,所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進(jìn)入“納什均衡”狀態(tài)。如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。只有在政府加強污染管制時,企業(yè)才會采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。
貿(mào)易戰(zhàn)博弈
貿(mào)易戰(zhàn)對于剛剛加入WTO的中國而言尤為重要。任何一個國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實行貿(mào)易保護(hù)主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個“納什均衡”,這個均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。X國試圖對Y國進(jìn)行進(jìn)口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會進(jìn)行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如X和Y能達(dá)成
合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。
博弈論--這是一個熱得燙手的概念。它不僅僅存在于數(shù)學(xué)的運籌學(xué)中,也正在經(jīng)濟(jì)學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟(jì)學(xué)獎就頻頻授予博弈論研究者),但如果你認(rèn)為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯了。實際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。
諾貝爾經(jīng)濟(jì)學(xué)獎獲得者包羅·薩繆爾遜如是說:
要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解。
也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
企業(yè)博弈
博弈論是分析寡頭壟斷企業(yè)市場行為的有力工具。博弈論研究機智而又理性的經(jīng)濟(jì)活動主體,在其行為相互影響時的決策以及這種決策的均衡問題。
重復(fù)博弈
囚徒困境,砸了傳統(tǒng)經(jīng)濟(jì)學(xué)的場子。因為個人的自利行為,并不一定導(dǎo)致集體利益的最大化,“看不見的手”拉不住,人類向墮落之城下滑的趨勢,難道這真是一個悲哀?索性并非如此,撇去博弈論的理性假設(shè)不說。博弈論者很快發(fā)現(xiàn)囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重復(fù),合作將到來。因為,未來的收益將左右目前的決策。
以牙還牙
重復(fù)的博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),因為之前已經(jīng)說過,合作的代價是建立在損害個人利益基礎(chǔ)之上的。如果個人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險仍然存在。那么在重復(fù)博弈中怎樣的策略才是最優(yōu)。若干睿智而復(fù)雜在經(jīng)過計算機中PK之后,極其原始的“以牙換牙”策略脫穎而出,固然這個策略簡單至極,其威力卻無窮,以至于人們在短暫的欣喜之后,發(fā)現(xiàn)這把太阿指之劍倒持的可怕,一旦重復(fù)鏈條中出現(xiàn)一次(也許不經(jīng)意的)背叛,那據(jù)此原則行事的博弈將永無止境的背叛下去,個人利益極度膨脹的同時,集體利益無限衰微。幸好,這個世界不是模型,也不是如此簡單。很多時候,我們不必以牙還牙,第三方的規(guī)范:道德與法律就是我們的假牙,他們更加有利、有理、有節(jié)。
人質(zhì)困境
一場憋屈的博弈。搶打出頭鳥,人質(zhì)聯(lián)合固然可以制服歹徒,但是誰愿出頭。這一點給了無數(shù)處于劫持者地位的一方以機會,類似于秦的遠(yuǎn)交近攻、各個擊破的策略,將最終全盤贏下。人質(zhì)可有反制的策略,當(dāng)然有,不過艱難至極。人質(zhì)可以選擇沉默,這樣他有一定時間茍延殘喘;或者聯(lián)合劫持者對付人質(zhì),結(jié)局還是取決于劫持者,萬一他過河拆橋怎么辦;同時反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。這里是實力與勇氣的較量,而且實力暫居上風(fēng)。
酒吧博弈
如果人人理性,那么每一天到達(dá)酒吧的人數(shù)將是差不多正好的,但是人非圣賢,往往是有限理性的。第一次到酒吧的人多,那么大多人人認(rèn)為酒吧人太多,太擠。第二次決定的時候,參考前次而不去酒吧。少數(shù)去的人發(fā)現(xiàn)酒吧的人第二天很少,感覺很爽,第三次將繼續(xù)回來,并重新帶回許多人……循環(huán)就此開始。酒吧博弈一方面顯示,現(xiàn)實的博弈參與者,是極其有限理性的,其理性只前延后伸一小段。歷史數(shù)據(jù)只對計算機有用,對人,則不一定。
另一個方面,酒吧博弈指出,勝利者永遠(yuǎn)只是少數(shù)。盡管酒吧存在調(diào)諧的可能,譬如發(fā)短信時時提醒,但成本恐怕太高。而在其他場合,少數(shù)派可能更加會設(shè)置種種障礙阻止后進(jìn)者的上升。也就是說,我們的世界仍然是操弄在少數(shù)派的手中。不過,總算這個世界不是模型,少數(shù)派的道路到底還是有跡可循的。老練的將軍仍舊會在八卦迷陣中找到唯一的生門。若你想要,必須做一個更加老練的將軍。
槍手博弈
王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結(jié)局,將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標(biāo)。在這里,后發(fā)制人的弱勢者將勝出。以弱勝強,絕不是神話。
難道王者的命運就真如此不堪,呵,道別忘了每個理論模型都是有其前提的,擊破之中任何一個,王者仍將歸來。這就是先發(fā)優(yōu)勢。假設(shè)這是一場類似CS的競技,優(yōu)秀的槍手擊倒二號槍手,立刻獲得獎勵:盾牌。那么三號槍手將陷入絕境。不過,不管怎樣,這個博弈模型,到底給了弱勢者一份希望。機會永遠(yuǎn)存在。
獵鹿博弈
兩個獵人合作獵鹿獲得的收益將遠(yuǎn)大于分別獵兔的收益,戰(zhàn)略聯(lián)盟將開始。這或許是件好事,不過有取決于最后獵獲的鹿——這一公共資源的分配,如果分配得當(dāng),整體的效率將增加。如果一方主導(dǎo),另一方受損,那么帕累托改善無法進(jìn)行,合作可能終將破裂。
另外一個問題,更加大局的問題。合作的示范性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內(nèi)將呈幾何級數(shù)增長。但是最后,確是生態(tài)失衡,鹿群滅群。短暫的繁華之后,獵人將再一次回歸于原始獵兔生活。盡管為了避免這一悲劇,人類還有最后的希望:制度經(jīng)濟(jì)學(xué)的法寶——科斯定理以產(chǎn)權(quán)歸屬來解決外部經(jīng)濟(jì)問題。但由于談判成本以及可行性,人類社會的公共悲劇仍將不斷上演。
智豬博弈
混沌之前最后的博弈。小豬和大豬住在豬圈的一邊(食槽在這里),開啟食物的開關(guān)在另一頭,誰去踩,誰喪失先機。結(jié)果怎樣?是小豬選擇“搭便車”,大豬勤跑。因為小豬無論跑還是停,大豬的最優(yōu)策略都是策略都是去踩機關(guān)。不過在實際生活中。這里依舊存在兩種策略。
小豬的“搭便車”。大豬有的時候,自覺或不自覺地自封“俠之大者,為國為民”,并因此承受一些不能承受之重。《博弈論的詭計》指出美國戰(zhàn)后的行為極似大豬,戰(zhàn)后的美國竭力宣傳自己的普世價值觀,并深入到海外事務(wù),甚至不惜重金協(xié)助小國防務(wù)。這樣小國不自覺地對大國進(jìn)行了“剝削”。
大豬在擊破模型的一個假設(shè)之后,仍然有一個后發(fā)制人的機會。因為大豬和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那只有一條豪賭的路子:龜兔賽跑式的豪賭,但愿大豬打了個盹兒,他回來的時候,還能吃上一兩口,要不然真是賠了夫人又折兵了。據(jù)此,再也不難解釋為什么很多人切齒的騰訊,毫無顧忌地跟風(fēng),做QQ旋風(fēng),做拍拍,做滔滔。因為不甘心的小豬早早把新技術(shù)研發(fā)的前期搞定了,大豬們只需要悄悄跟隨,適當(dāng)?shù)臅r候踢開擋路的,就可以了。
大豬在這里的后發(fā)制人和槍手博弈的后發(fā)并不一致,槍手后發(fā)是建立在他人惡斗的基礎(chǔ)上,大豬后發(fā)完全是以自身實力為基礎(chǔ)。而且大豬完全不必采取任何激進(jìn)措施,只要跟隨就好。因為小豬獲勝的條件不是接近,還是距離。
警察與小偷
令人沮喪的博弈結(jié)局。警察和小偷各只有一個機會去巡查或者偷盜A地或B地。A地的價值大于B地,那么警察應(yīng)該為了保護(hù)價值大而一直保護(hù)A地嗎。博弈論認(rèn)為當(dāng)然不是,警察的合理策略應(yīng)當(dāng)是有傾向于A以一定概率的隨機巡查。這個概率就是:p=A地價值/AB地總價值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是,此時的小偷謀求的是,最小得手幾率的最大化。也就是說,警察的最優(yōu)策略將把小偷的最差策略改良!這個便是馮·諾伊曼提出的“最小最大定律”。
我們必須再一次感謝這個不完美的世界,因為現(xiàn)實之中,類似的現(xiàn)象,對于一方仍然可以設(shè)法找到對手致命的規(guī)律性行動(當(dāng)然必須考慮到對方是不是一個更加老練的獵手,故意放出的誘餌)。而保持自己的行動的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。
斗雞博弈
兩只斗雞在決斗的時候,無論選擇進(jìn)或退都是一個難題,因為納什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。在很多較量下,死拼將是得不償失的,因為很可能給第三者機會。因此,兩個已經(jīng)在戰(zhàn)場的強勢力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時,另一方暫退。雖然可能某方暫時受損,但較之于兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動攻勢的時候,另一方同樣的后退。于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。這只不過是兩個巨頭玩弄的游戲,目的是警告后來者,想進(jìn)來,那么也得陪我們一起玩,可是你玩的起么?這正是百事的廣告,即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。
協(xié)和謬誤
歐洲政府在大量投資協(xié)和飛機后,終于不能自拔。即使前景黯淡,也撐著面子投下去,非要走投無路才放棄。而這時投入的成本已經(jīng)全打水漂了。如果,發(fā)現(xiàn)不能繼續(xù)的時候,就果敢放手,損失會小得多??墒撬麄儠⒛苓@么做么?壯士斷腕,是何等的壯烈,卻也是何等的艱難!
沉沒成本很可能會延續(xù)人們無畏的堅持。已經(jīng)沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的杠桿終將啟動??上麄冊谂赖阶銐蚯藙痈軛U的支點之前,已經(jīng)窒息了。
協(xié)和謬誤,倒是給了人們半途而廢的理由,會不會有人擔(dān)心它的濫觴會左右一些本該堅持的目標(biāo)?的確有這個可能,但是應(yīng)該相信人們足夠理智,完全可以比較沉沒成本、機會成本與未來收益的關(guān)系??辞辶说模囟〞谷坏刈叱鰠f(xié)和謬誤。
蜈蚣博弈
一場顛前倒后的博弈。蜈蚣博弈的機理是以最終的結(jié)果倒退至開始。這是一個睿智的策略,因果相報,把握好因緣,自有好結(jié)果。它的另一個好處,就是使得未來的計劃明晰化,是你不再徘徊。只可惜,很多時候,碌碌無為的我們并沒有看透迷局的眼睛。我們黑色的眼睛只習(xí)慣于黑夜。
蜈蚣博弈也有一個致命的悖論,仍舊是個人利益和集體利益的沖突,因為最后一次的背叛收益始終優(yōu)于合作??杀氖?,這一次背叛將由于人性的理智,穿越時光隧道,回到原始的地點:人們將從開始就拒絕合作。還是感謝我們這個不完美的世界吧,事實上人們很少這樣做。當(dāng)然合作到最后的也很少,這意味著,倒推法只在中間階段突然發(fā)生了作用,只不過誰也不能預(yù)測,中間一步在哪里。在那里,我們只有冀望信任、道德、良知等等。
分蛋糕博弈
兩個小孩怎么分蛋糕?經(jīng)典的故事,經(jīng)典的解答:一個分,一個選?,F(xiàn)實多如此,權(quán)利的合理分配將有效促進(jìn)公平與效率。經(jīng)營權(quán)與所有權(quán)的分置的確使得經(jīng)濟(jì)更加活力。不過分蛋糕的進(jìn)階模型卻強調(diào)了討價還價的策略,分蛋糕不是一次性的,而是多回合的,而且出現(xiàn)成本:蛋糕在融化。
時間稱本的加入,將使得分配變得復(fù)雜化。雙方如果不能及時達(dá)成交易,不僅集體的收益將減量,而且個體的收益也將減少。在此情況下,利用時間稱本以及威脅、承諾將對其中一方極其有利。顧客可能迫于情勢,必須盡快結(jié)束談判,這時賣方卻不慌不忙,故意拖延,顧客一方將不得不在價格上作出妥協(xié)。
顧客一方當(dāng)然也有策略,它的策略就是貨比三家,要求承諾或威脅。這個前提是買方市場的存在。顧客還應(yīng)當(dāng)保護(hù)自己討價還價的能力,這就是顧客有權(quán)投訴商家。
鷹鴿博弈
這個博弈很多人等同于斗雞博弈。不過,斗雞是兩個兼具侵略性的個體,鷹鴿卻是兩個不同群體的博弈,一個和平,一個侵略。在只有鴿子一個苞谷場里,突然加入的鷹將大大獲益,并吸引同伴加入。但結(jié)果不是鷹將鴿逐出苞谷場,而是一定比例共存,因為鷹群增加一只鷹的邊際收益趨零時(鷹群發(fā)生內(nèi)斗),均衡將到來。
由此產(chǎn)生了ESS進(jìn)化上的穩(wěn)定策略,也就是說一旦均衡形成,偏離的運動會受到自然選擇的打擊。也就是鷹群飽滿后,再試圖加入的鷹將會被鷹群排擠。
進(jìn)化上的穩(wěn)定均衡最大的好處莫過于保持穩(wěn)定。但問題在于形成強勢的路徑依賴,也就是勝出的不一定是最好的。因為最好的會被當(dāng)作出頭鳥干掉,這是個體的失敗,集團(tuán)的勝利以及集體的止步不前。
臟臉博弈
恍然大悟的博弈。三個人在屋子里,不許說話。美女進(jìn)來說:你們當(dāng)中至少一個人臉是臟的。三人環(huán)看,沒有反應(yīng)。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什么?因為美女后一句廢話點破天機,三個人都知道臟臉的存在,而且推測知道對方也知道了臟臉的存在(因為另兩人臉沒紅,說明他們看到臟臉了),而且知道對方知道自己已經(jīng)想到上一步……循環(huán)開始,知識開始共同化,真相大白:三個人都是臟臉,所有人都臉紅了。
這就是共同知識的作用,它的作用顯得有點可怕的強大。幾乎是一招無影腿,殺人不見血。在臺面上的博弈之前,私下的算計已經(jīng)置對手于死地。不過,很可能對方也預(yù)料到這一點,早也想到這一點,同時殺來。終于,形成雙死局面。
當(dāng)然,現(xiàn)實雖然存在類似現(xiàn)象,不過共同知識更大的作用在于減少交易成本。因為某些規(guī)則人盡皆知,雙方只要各自依之行事就可以了。
信息均衡
很顯然,信息的作用在博弈之中非常重要。將博弈論還原到現(xiàn)實,人們不再完全理性,信息存在不對稱,博弈就需要在搶占信息高地上作出努力。
信息不對稱,是一個很大的障礙。信息的不對稱會造成“逆向選擇”和“道德風(fēng)險”,前者事前,后者事后。信息不對稱短期內(nèi)對某一方會有利,但最終會破壞整個市場。于是有兩個解決策略。
信息傳遞
傳達(dá)你的正面的信息的策略,也就是說吸引顧客走到你的柜臺面前。它的要點是保持有效、減低成本。
信息甄別
誘導(dǎo)對手暴露其私下?lián)碛械恼鎸嵭畔?。就是給顧客一個放大鏡,保證顧客不會走到其他柜臺去。這種策略顯然更加有效,不過風(fēng)險也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎么辦