博弈論是研究互動決策的方法論。既然是互動決策,博弈便不是一個人的決策。每個人的身邊都是和他一樣的決策者。甲的決策對乙的決策產(chǎn)生影響,同樣乙的決策也影響著甲的決策。乙的決策是對甲的決策的回應(yīng),同樣甲的決策是對乙的決策做出的反應(yīng)。人們往往沒有意識到在決策時考慮了別人可能的反應(yīng),然而在現(xiàn)實生活中,人們的決策很可能是本能地,但又不經(jīng)意地對別人的決策做出的反應(yīng)。人們常說,出招的時候要先考慮對方會怎么回招,這個思考方法便是博弈思維。
人們的決策相互影響的例子很多。比如:戀愛中的情侶,他們之間的約會、示愛的行為存在著相互影響的決策關(guān)系;冷戰(zhàn)時期的美蘇核平衡是一種互動決策關(guān)系;寡頭市場上,寡頭企業(yè)關(guān)于產(chǎn)量和價格的決策是雙方在考慮對方?jīng)Q策的基礎(chǔ)上做出的回應(yīng);稅務(wù)局與納稅企業(yè)之間,稅收稽查與逃稅行為之間存在互動決策關(guān)系;道路上行駛的汽車駕駛員在做“駕駛博弈”的互動;企業(yè)與工會之間的工資談判是勞資談判博弈。
一個博弈由三個要素構(gòu)成。一是參與人,在一場博弈中,參與該博弈并有決策權(quán)的人就是參與人。二是策略,策略是實際可行的行動方案和行動規(guī)則,這個行動規(guī)則不是參與人某一個或者幾個行動的規(guī)則,而是貫穿整個博弈過程和全局的行動方案和規(guī)則。三是得失或收益,參與人參與博弈必然有其利益在其中,人們之所以參與博弈是受到利益的吸引,對未來所獲得利益的大小的預(yù)期直接關(guān)系到參與人的策略和博弈結(jié)果。得失或收益就是指參與人在博弈中能夠獲得什么樣的利益,這個利益不是純粹的經(jīng)濟(jì)利益,而是參與人使自己的各種需求、欲望得到的滿足。博弈參與人在博弈中追求的是自身收益的最大化,而最大化的收益需要參與人尋找最佳策略(行動規(guī)則)來實現(xiàn)。
例如,駕駛博弈中,博弈的參與人是在路上駕駛的駕駛員。駕駛員的策略有:當(dāng)別人靠右行駛時,我也靠右行駛;當(dāng)別人靠右行駛時,我靠左行駛;當(dāng)別人靠左行駛時,我也靠左行駛;當(dāng)別人靠左行駛時,我靠右行駛。我們可以假設(shè)如果駕駛員都在同一個方向行駛,大家都得益,每人收益為1;大家都逆向行駛,行車不便,甚至撞車,每個駕駛員收益為-1。這個博弈的最優(yōu)策略是當(dāng)別人靠右行駛時,我也靠右行駛,或者當(dāng)別人靠左行駛時,我也靠左行駛。博弈的結(jié)果是大家都靠一邊行駛,要么像我國一樣靠右行駛,要么像英國一樣靠左行駛,每個駕駛員的收益是1。
博弈論的基本思維方法是向前展望,往回推理。向前展望就是在決策的時候要先考慮自己的決策可能引起對手的后續(xù)反應(yīng),以及后續(xù)反應(yīng)之后的反應(yīng),依此推斷對手在博弈中一步步接下來的反應(yīng),看清自己的行動將會導(dǎo)致怎樣的后果,以及在對手做出反應(yīng)后,雙方的行動會出現(xiàn)什么結(jié)果。往回推理就是在向前展望的基礎(chǔ)上,將展望的結(jié)果作為最初決策的相關(guān)因素加以考慮,從最后一步的結(jié)果開始,逐步往回倒推,只到博弈開始的第一步,找出自己在每一步的最優(yōu)選擇。例如,博弈中帶有一個“弈”字就是因為下棋叫作對弈。下棋的思考過程就是典型的博弈思維過程。下棋的時候,棋手要向前盤算幾步,并且考慮自己每一步的出招對方會怎么回招,自己再怎么接這個回招,以及這一個回合對下一個回合的后續(xù)影響,這是向前展望。在考慮好了后,再往回推理自己當(dāng)前應(yīng)該選擇走出哪一步棋在后續(xù)的對弈回合中對自己最有利。