房地產(chǎn)開發(fā)博弈、警察捉小偷與混和策略
實(shí)際上,在每個(gè)參與人都有優(yōu)勢(shì)策略的情況下,優(yōu)勢(shì)策略均衡是非常合乎邏輯的。一個(gè)優(yōu)勢(shì)策略優(yōu)于其他任何策略,同樣,一個(gè)劣勢(shì)策略則劣于其他任何策略。
假如你有一個(gè)優(yōu)勢(shì)策略,你可以選擇采用,并且知道你的對(duì)手若是有一個(gè)優(yōu)勢(shì)策略他也會(huì)照辦;同樣,假如你有一個(gè)劣勢(shì)策略,你應(yīng)該避免采用,并且知道你的對(duì)手若是有一個(gè)劣勢(shì)策略他也會(huì)規(guī)避。
但遺憾的是,并不是所有博弈都有優(yōu)勢(shì)策略,哪怕這個(gè)博弈只有兩個(gè)參與者。實(shí)際上,優(yōu)勢(shì)策略只是博弈論的一種特例。雖然出現(xiàn)一個(gè)優(yōu)勢(shì)策略可以大大簡(jiǎn)化行動(dòng)的規(guī)則,但這些規(guī)則卻并不適用于大多數(shù)現(xiàn)實(shí)生活中的博弈。
來看這樣一個(gè)房地產(chǎn)開發(fā)博弈的例子。假定北京市的房地產(chǎn)市場(chǎng)需求有限,A、B兩個(gè)開發(fā)商都想開發(fā)一定規(guī)模的房地產(chǎn),但是市場(chǎng)對(duì)房地產(chǎn)的需求只能滿足一個(gè)房地產(chǎn)的開發(fā)量,而且,每個(gè)房地產(chǎn)商必須一次性開發(fā)這一定規(guī)模的房地產(chǎn)才能獲利。在這種情況下,無論是對(duì)開發(fā)商A還是開發(fā)商B,都不存在一種策略完全優(yōu)于另一種策略,也不存在一個(gè)策略完全劣于另一個(gè)策略。
因?yàn)椋绻吝x擇開發(fā),則B的最優(yōu)策略是不開發(fā);如果A選擇不開發(fā),則B的最優(yōu)策略是開發(fā);類似地,如果B選擇開發(fā),則A的最優(yōu)策略是不開發(fā);如果B選擇不開發(fā),則A的最優(yōu)策略是開發(fā)。這樣就形成了一個(gè)循環(huán)選擇。
根據(jù)納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。即雙方在對(duì)方給定的策略下不愿意調(diào)整自己的策略。
這個(gè)博弈的納什均衡點(diǎn)不止一個(gè),而是兩個(gè):要么A選擇開發(fā),B不開發(fā);要么A選擇不開發(fā),B選擇開發(fā)。在這種情況下,A與B都不存在優(yōu)勢(shì)策略,也就是A和B不可能只要選擇某一個(gè)策略而不考慮對(duì)方的所選擇的策略。實(shí)際上,在有兩個(gè)或兩個(gè)以上納什均衡點(diǎn)的博弈中,其最后結(jié)果難以預(yù)測(cè)。在房地產(chǎn)博弈中,我們無法知道,最后結(jié)果是A開發(fā)B不開發(fā),還是A不開發(fā)B開發(fā)。
再來看這樣一個(gè)警察捉小偷博弈的例子。某個(gè)村莊上只有一名警察,他要負(fù)責(zé)整個(gè)村的治安。小村的兩頭住著兩個(gè)全村最富有的村民A和B,A、B分別需要保護(hù)的財(cái)產(chǎn)為2萬元、1萬元。整個(gè)小村某一天來了個(gè)小偷,要在村中偷盜A和B的財(cái)產(chǎn),這個(gè)消息被警察得知。
因?yàn)榉稚矸πg(shù),警察一次只能在一個(gè)地方巡邏;而小偷也只能偷盜其中一家。若警察在某家看守財(cái)產(chǎn),而小偷也選擇了去該富戶家,就會(huì)被警察抓?。蝗艟鞗]有看守財(cái)產(chǎn)的富戶家而小偷去了,則小偷偷盜成功。
一般人會(huì)憑著感覺認(rèn)為,警察當(dāng)然應(yīng)該看守富戶A家財(cái)產(chǎn),因?yàn)锳有2萬元的財(cái)產(chǎn),而B只有1萬元的財(cái)產(chǎn)。實(shí)際上,對(duì)于警察的一個(gè)最好的做法是,警察抽簽決定去A家還是B家。
因?yàn)锳家的財(cái)產(chǎn)是B家的2倍,小偷自然光顧A家的概率要高于B家,不妨用兩個(gè)簽代表A家,比如如果抽到1、2號(hào)簽去A家,抽到3號(hào)簽去B家。這樣警察有2/3的機(jī)會(huì)去A家做看守,1/3的機(jī)會(huì)去B家做看守。
而小偷的最優(yōu)選擇是:以同樣抽簽的辦法決定去A家還是去B家實(shí)施偷盜,只是抽到1、2號(hào)簽去A家,抽到3號(hào)簽去B家,那么,小偷有l(wèi)/3的機(jī)會(huì)去A家,2/3的機(jī)會(huì)去B家。這些數(shù)值是可以通過聯(lián)立方程準(zhǔn)確計(jì)算出的,筆者這里就不給出具體的數(shù)學(xué)計(jì)算過程了。
細(xì)心的讀者會(huì)發(fā)現(xiàn),警察捉小偷博弈與前面所舉的兩個(gè)博弈案例有一個(gè)很大的差別,就是用到了概率的知識(shí),警察與小偷沒有一個(gè)一定要選擇某個(gè)策略的納什均衡,而只有選擇某個(gè)策略是多少幾率的納什均衡。
在博弈論中,可以選擇出某個(gè)策略的納什均衡,這個(gè)策略叫做純策略。
用專業(yè)的話來說,所謂純策略是指參與者在他的策略空間中選取惟一確定的策略。但至少存在一個(gè)混合策略均衡點(diǎn)。
所謂混合策略是指參與者采取的不是惟一的策略,而是其策略空間上的概率分布。這就是納什于1950年證明了的納什定理。而這個(gè)博弈沒有純策略納什均衡點(diǎn),而有混合策略均衡點(diǎn)。這個(gè)混合策略均衡點(diǎn)下的策略選擇是每個(gè)參與者的混合策略選擇。
最常見混和策略就是猜硬幣游戲。比如在足球比賽開場(chǎng),裁判將手中的硬幣拋擲到空中,讓雙方隊(duì)長(zhǎng)猜硬幣落下的正反面。由于硬幣落下是正是反是隨機(jī)的,概率應(yīng)該都是1/2。那么,猜硬幣游戲的參與者都是1/2的概率選擇正與反,這時(shí)博弈達(dá)到混和策略納什均衡。
再比如我們兒時(shí)玩的“剪、布、錘”就不存在純策略均衡,對(duì)每個(gè)小孩來說,自己采取出“剪”、“布”、還是“錘”的策略應(yīng)當(dāng)是隨機(jī)的。一旦一方知道另一方出其中某個(gè)策略的可能性增大,那么這個(gè)對(duì)弈者在游戲中輸?shù)目赡苄跃驮龃蟆R虼?,每個(gè)小孩的最優(yōu)混合策略是采取每個(gè)策略的可能性是l/3。在這樣的博弈中,每個(gè)小孩各取三個(gè)策略的1/3是納什均衡。
由此可見,純策略是參與者一次性選取的,并且堅(jiān)持他選取的策略。而混合策略是參與者在各種備選策略中采取隨機(jī)方式選取的。
在博弈中,參與者可以改變他的策略,而使得他的策略選取滿足一定的概率。當(dāng)博弈是零和博弈時(shí),即一方所得是另外一方的所失時(shí),此時(shí)只有混合策略均衡。對(duì)于任何一方來說,此時(shí)不可能有純策略的占優(yōu)策略。