前言
博弈論的思想在古代便產(chǎn)生了,只是它在初期僅研究象棋、賭博中的一些勝負(fù)問題,并未形成專業(yè)的理論系統(tǒng)。當(dāng)時(shí)的人們對(duì)于博弈的認(rèn)識(shí)只停留在經(jīng)驗(yàn)的認(rèn)知和積累上,并未形成專業(yè)的理論基礎(chǔ),正式成為一門學(xué)科則是在20世紀(jì)初期。
20世紀(jì)20年代末期,約翰·馮·諾依曼正式證明了博弈的基礎(chǔ)原理,在此基礎(chǔ)上宣告博弈論誕生,因此,馮·諾依曼被稱為“博弈論之父”。再到20世紀(jì)40年代中期,一本跨越時(shí)代的巨著《博弈論與經(jīng)濟(jì)行為》問世,而作者正是馮·諾依曼和摩根斯坦。這兩位卓越的數(shù)學(xué)家經(jīng)過不斷研究,最終將最初的二人博弈理論推廣到了n人博弈理論,還將博弈論成功應(yīng)用到經(jīng)濟(jì)領(lǐng)域,他們奠定了博弈論的基礎(chǔ)和理論體系。
“假設(shè)現(xiàn)在有人能夠讓博弈行為接近野蠻,或者讓人類之間的友善行為和兇殘行為之間的差距無限大,那么誰就更容易在博弈中取勝!边@是《博弈圣經(jīng)》中提到的一段話。
提起博弈論,便需要說起“孤獨(dú)的天才”——約翰·納什,他更是博弈論的天才。約翰·納什在20世紀(jì)中期正式發(fā)表了一篇論文——《n人博弈的均衡點(diǎn)》,對(duì)博弈論起到了良好的推動(dòng)作用。除此之外,哈桑尼與賽爾頓對(duì)博弈論的研究和貢獻(xiàn),也為博弈論的發(fā)展起到了催化作用。再到《博弈圣經(jīng)》問世,它與原有的博弈論有著極大的區(qū)別,最大的差異在于《博弈圣經(jīng)》中論述了博弈的文化理論,突出表現(xiàn)了人類博弈占據(jù)的優(yōu)勢(shì)。
事實(shí)上,《博弈圣經(jīng)》最大的優(yōu)點(diǎn)是,它能夠?qū)⒃械牟┺睦碚撜綉?yīng)用到現(xiàn)實(shí)中,還能幫助普通大眾通過自身的學(xué)習(xí)和研究成為博弈的真正高手。它還能將博弈論應(yīng)用到政治、經(jīng)濟(jì)、文化等多個(gè)領(lǐng)域,對(duì)于個(gè)人的生活和發(fā)展也能起到促進(jìn)和推動(dòng)作用。
簡(jiǎn)單來說,博弈的基本構(gòu)成要素分為決策人、對(duì)抗者、生物親序、局中人、策略、得失、次序。所謂決策人,指的是在博弈的賽局中率先做出選擇的一方,決策人往往會(huì)根據(jù)自己的經(jīng)驗(yàn)、自身在對(duì)局中的感受、自身的狀態(tài)等,率先做出一種具有方向性的選擇。
在二人博弈對(duì)局中的對(duì)抗者,往往是選擇滯后的那個(gè)人,需要做出與決策人的行為相反的選擇,而且這個(gè)對(duì)抗者不僅選擇落后,連行為與動(dòng)作也是落后的,而且他的選擇幾乎是默認(rèn)的、被動(dòng)的,但是這將成為他最后的優(yōu)勢(shì)。簡(jiǎn)單說,他所做的選擇極有可能是基于決策者選擇中的劣勢(shì)而做出的,由此一來,便具有了空間優(yōu)勢(shì),這樣看來對(duì)抗者便成了二人博弈中占優(yōu)的一方。
所謂生物親序,從字面理解,就是生物會(huì)主動(dòng)尋找有序的一種親近行為。由于自然界的所有生物,當(dāng)它們處在陌生、惡劣、未知環(huán)境中時(shí),它們會(huì)發(fā)揮出主動(dòng)尋找規(guī)律和有序環(huán)境的本能。同理,在博弈對(duì)局中,所有的參與者都會(huì)自發(fā)地產(chǎn)生尋找或者等待有序的親近行為。
我們知道一場(chǎng)競(jìng)賽會(huì)由參與者組成,而在博弈中,這些有決策權(quán)力的參與者,則被稱為博弈賽局中的一個(gè)局中人;若在博弈中有兩個(gè)局中人,那么便稱為“兩人博弈”;若在博弈中有多個(gè)局中人,則稱為“多人博弈”。
當(dāng)我們參加較為正規(guī)的比賽時(shí),在遵守規(guī)則的前提下,還會(huì)為自己制訂一定的計(jì)劃或者策略,幫助自己取勝,博弈亦是如此。在一場(chǎng)博弈賽局中,任意一個(gè)局中人都會(huì)制訂自己在實(shí)際情況中所要施行的計(jì)劃或者策略,簡(jiǎn)單來說,局中人的方案與計(jì)劃并不只是針對(duì)某一個(gè)階段,而是針對(duì)整個(gè)對(duì)局過程,即任何一個(gè)局中人的能夠貫穿整個(gè)賽局的可行計(jì)劃被稱為一個(gè)局中人的策略。假設(shè)在一個(gè)博弈賽局中,局中人的策略是有限的,便稱其為“有限博弈”,相反則稱為“無限博弈”。
在博弈賽局中,結(jié)果無非勝負(fù)兩種,這種結(jié)果便是博弈中的得失。任何一個(gè)局中人在博弈中的最終得失,都與局中人的決策密切相關(guān),甚至還與全局中的人所做出的一組決策密不可分。因此,每場(chǎng)博弈中的局中人的最終得失,都由全部的局中人做出的一組策略的函數(shù)決定,這組函數(shù)便是通常意義上的支付函數(shù)。
比賽次序有先后,博弈策略亦是如此。博弈中的決策方在一個(gè)賽局中需要做出多次決策,此時(shí)便會(huì)出現(xiàn)決策的次序問題。在此過程中,只有決策的次序是不同的,但是其他要素是相同的,而最后出現(xiàn)的是不同的博弈結(jié)果。
根據(jù)不同的標(biāo)準(zhǔn)產(chǎn)生了不同的博弈種類。我們可以將其大致分為兩類,即通常意義上的合作博弈和非合作博弈。二者的最大差別在于參與博弈的人并沒有達(dá)成一個(gè)相對(duì)具有約束力的協(xié)議。假設(shè)有協(xié)議可以參照,便是“合作博弈”;反之,則是“非合作博弈”。
若以時(shí)間順序?yàn)榛鶞?zhǔn),博弈論可以分為兩類:靜態(tài)博弈和動(dòng)態(tài)博弈。前者是指在博弈中,所有的參與者共同選擇或者非同時(shí)做出選擇,但是所有的后參與者對(duì)此并不知情,即后參與者不知道最初的參與者做出了怎樣的決策和實(shí)際行動(dòng)。后者是指在博弈中,所有的參與者采取的具體行動(dòng)有先后之分,而且后來加入的參與者能夠非常清晰地看到前面的參與者的具體行動(dòng)。
簡(jiǎn)言之,“囚徒困境”屬于靜態(tài)博弈,而棋牌類的博弈,或者那些行動(dòng)、決策有先后的博弈則是“動(dòng)態(tài)博弈”。事實(shí)上,博弈論根據(jù)不同的基準(zhǔn)還有不同的分類,在此列舉較為基礎(chǔ)的幾種。本書《博弈論》將帶領(lǐng)讀者走進(jìn)博弈的賽局中,開始一場(chǎng)特殊的“博弈”之旅。
譯者序
策略博弈論,我們通常將它稱為博弈論,有些時(shí)候也會(huì)用“競(jìng)賽論”或者“對(duì)策論”來表示。但是,只有博弈論更符合原意,因?yàn)樗軌蚋玫乇磉_(dá)出此理論所要探究的基本概念和相關(guān)問題,同時(shí),它是在最近十幾年間逐漸發(fā)展起來的,還是運(yùn)籌學(xué)的主要組成部分,本書是博理博弈論的經(jīng)典著作。
約翰·馮·諾依曼的這本思想史上的經(jīng)典之作已經(jīng)問世20年之久。本書《博弈論》不僅是成千上萬讀者的審美享受,還支撐著約翰·馮·諾依曼之后的研究者。與此同時(shí),《博弈論》還直接推動(dòng)了個(gè)人概率、統(tǒng)計(jì)決策、運(yùn)籌學(xué)等諸多問題的研究進(jìn)程。實(shí)際上,這本經(jīng)典著作在各個(gè)領(lǐng)域都產(chǎn)生了一定的影響。
為了讓讀者能夠更加直觀地看到博弈中的邏輯推理,馮·諾依曼先構(gòu)造出一個(gè)概念,其包含了所有參與者的策略選擇。通俗意義上說,一個(gè)參與者的一個(gè)策略選擇就是一套簡(jiǎn)單的行動(dòng)法則,同時(shí)是提供給這個(gè)參與者所有可能情況下的行動(dòng)指導(dǎo)。假設(shè)任意一名參與者需要遵循給定的各種策略,那么博弈的整個(gè)過程可以說是已知的,顯而易見所有參與博弈的人在博弈結(jié)束時(shí),能夠獲得的收益其實(shí)是確定的。
按照作者約翰·馮·諾依曼的觀點(diǎn),博弈論的方法是最適合研究經(jīng)濟(jì)方面的問題的數(shù)學(xué)方法。盡管博弈論的提出沒有能夠幫助作者完成解決經(jīng)濟(jì)問題的任務(wù),但這一數(shù)學(xué)理論的提出與建立仍然是具有里程碑意義的。因?yàn)椴┺恼撗芯康氖嵌窢?zhēng),因此,在無數(shù)的斗爭(zhēng)場(chǎng)景中,都有可能通過使用博弈論來解決相關(guān)的技術(shù)問題。例如人對(duì)自然財(cái)富的索取,人對(duì)自然災(zāi)害的抵抗,人對(duì)于未知領(lǐng)域的探索,以及軍事上的斗爭(zhēng),等等。博弈論可以使人們?cè)谟邢薜臈l件和既定的要求下,從繁多的數(shù)量關(guān)系里尋找出最適宜、最高效的解決方案。
約翰·馮·諾依曼創(chuàng)作《博弈論》的初衷是推動(dòng)經(jīng)濟(jì)學(xué)理論的革命,但是它在很長(zhǎng)一段時(shí)間內(nèi)沒有完成這個(gè)偉大的目標(biāo)。不過,在它的影響下,人們發(fā)起了對(duì)整個(gè)時(shí)代經(jīng)濟(jì)學(xué)理論的質(zhì)疑。從這一方面來看,《博弈論》確實(shí)是天才之作,因此它必將被世人永遠(yuǎn)銘記。
經(jīng)濟(jì)學(xué)在未來是什么樣子的?這在《博弈論》中已經(jīng)予以回答。它必將是充滿數(shù)學(xué)符號(hào)的。對(duì)不少人來說,《博弈論》更像一部希臘文著作,只有當(dāng)我們理解它超過理解一種文化時(shí),我們才能真正讀懂它;蛘,如果說《博弈論》是貝多芬的一部樂曲,那么還需要懂樂譜的人才能理解它。對(duì)于音盲來說,再好的音樂也無異于噪音。《博弈論》中最好的工具是數(shù)學(xué),如果有人對(duì)數(shù)學(xué)一無所知,那么他很難進(jìn)入現(xiàn)代科學(xué)的大門,或邁入現(xiàn)代哲學(xué)的世界,這無疑是令人遺憾的。數(shù)學(xué)不同于街頭俗論,它關(guān)系著許多方面的思維能力。一般來說,擁有數(shù)學(xué)潛力的孩子往往具有更好的語(yǔ)言和邏輯能力。
能否理解博弈論可以作為衡量21世紀(jì)文化人的標(biāo)準(zhǔn)。約翰·馮·諾依曼在《博弈論》中對(duì)多人博弈和個(gè)體最大化問題進(jìn)行了區(qū)分,并指出了兩者的主要差異。例如,研究一個(gè)典型的最大化問題:如何用周長(zhǎng)1英里的籬笆圍出最大的面積?對(duì)于這個(gè)問題,我們只需要利用代數(shù)或微積分知識(shí)便可給出答案。若縮小范圍,只允許在三角形中做選擇,那么等邊三角形要比其他三角形更優(yōu);若只允許在四邊形中做選擇,那么正方形是最佳的答案。若在所有正多邊形中做選擇,那么邊數(shù)越多越接近最優(yōu)解。而如果沒有邊數(shù)限制,用周長(zhǎng)1英里的籬笆圍出最大的面積,圓形無疑是最佳選擇。
而在多人博弈中,比如當(dāng)兩個(gè)理性頭腦為了一個(gè)目標(biāo)而產(chǎn)生沖突的時(shí)候,最終的答案總是會(huì)同時(shí)依賴于兩者的決定,所以這時(shí)的形勢(shì)與個(gè)人最大化問題的形勢(shì)便不再相同。兩個(gè)人一起玩井字棋時(shí),如果甲方先行,且行棋方式完全正確,那么乙方將永遠(yuǎn)無法擊敗他;同樣,若乙方先行,且行棋方式完全正確,那么甲方也永遠(yuǎn)無法擊敗他。這種博弈的方式是隨機(jī)的,它的解也是隨機(jī)的。
如果兩個(gè)人一起玩向圓桌上放硬幣的游戲:雙方輪流向桌子上放硬幣,率先放不下硬幣的人就算失敗。在這個(gè)博弈中,若A是先行者,他便可以用這樣的策略獲勝,即首先將一枚硬幣放在桌子的正中央,接著每當(dāng)對(duì)方放下一枚硬幣,就在與之對(duì)稱的位置上放上一枚硬幣,這樣一來,他便永遠(yuǎn)不會(huì)輸。所以誰后放誰就會(huì)輸。這是一個(gè)完美的信息博弈,只要知道誰先誰后就能知道誰贏誰輸。
同樣,象棋也是一個(gè)完美信息博弈,它與上面兩種博弈一樣簡(jiǎn)單。若兩個(gè)計(jì)算能力完美的人一起下象棋,那么只會(huì)有三種可能:一是先行者必勝,二是后行者必勝,三是平局。初看之下,我們并不知道最終的結(jié)局究竟屬于哪一個(gè),但只要我們反向推導(dǎo),就能推算出這一博弈結(jié)局與開始信息的關(guān)系。象棋的這種簡(jiǎn)單屬性可由博弈論予以證明。
在大多數(shù)人看來,猜硬幣與下象棋一樣都是簡(jiǎn)單的博弈。但實(shí)際上,猜硬幣并非人們想象的那樣簡(jiǎn)單。如果一個(gè)人要想與另一個(gè)人保持一樣,他就會(huì)在對(duì)方選擇正面時(shí)跟著選擇正面,在對(duì)方選擇背面時(shí)跟著選擇背面。但是,如果他一開始就知道對(duì)方準(zhǔn)備選擇正面,好勝心就會(huì)驅(qū)使他去選擇背面,而若對(duì)方選擇的是背面,他就會(huì)毅然選擇正面。這就形成了一個(gè)無法跳出的循環(huán)。
約翰·馮·諾依曼在處理這個(gè)無限循環(huán)問題時(shí)表現(xiàn)出了自己的天賦。在他看來,不讓別人知道你的秘密的前提是,你自己也不知道;在投擲硬幣的時(shí)候,你只需要以正反面來決定你的行動(dòng),這樣一來,在這個(gè)隨意策略中,即使你的對(duì)手始終保持著理性,并能提前知曉你的策略,他也不可能以超過半數(shù)的概率戰(zhàn)勝你。
約翰·馮·諾依曼給我們呈現(xiàn)的是一個(gè)二人零和博弈。他用這個(gè)經(jīng)典的博弈向我們證明了他的理論:參與這個(gè)零和博弈的人都試圖使自己的利益最大化,于是他們都想盡可能地使對(duì)方的利益最小化,因?yàn)橹挥羞@樣才能最大化自己的利益。
要判斷一條鐵鏈的強(qiáng)度,我們首先要知道它最弱的一環(huán),要判斷一個(gè)木桶能盛多少水,首先要知道它的短板在哪里。在最壞的情況下,最可能獲得的收益取決于最脆弱的一點(diǎn)。這個(gè)時(shí)候,參與者只需采用一種隨機(jī)策略,就能在最壞的情況下最大化自己的收益。這一意義深遠(yuǎn)的定理可以在撲克牌游戲中顯露其冰山一角:我們?cè)谕鎿淇伺茣r(shí)常常會(huì)見到虛張聲勢(shì)的對(duì)手,甚至我們自己有時(shí)為了贏得最后的勝利,也會(huì)采取虛張聲勢(shì)的策略。我們發(fā)現(xiàn)一旦有人虛張聲勢(shì)就意味著他可能有一手差牌,而那些不動(dòng)聲色的人則很可能拿到一手好牌。如果你的對(duì)手為了最大化自己的收益采取了隨機(jī)策略,那么你在面對(duì)這樣的對(duì)手時(shí)有一個(gè)最優(yōu)的虛張聲勢(shì)率可以確保使你的利益最大化。這種情況也出現(xiàn)在考試中,一個(gè)老師在為學(xué)生出考試題時(shí)會(huì)隨機(jī)從教科書中抽取內(nèi)容,這樣一來,學(xué)生就需要復(fù)習(xí)整本教科書才能保證自己考到最優(yōu)的分?jǐn)?shù)。
除了簡(jiǎn)單的兩人零和博弈外,其他博弈中的理論更加復(fù)雜,也更加具有不確定性。比如,賽馬、股票交易、國(guó)際談判等多參與者形式的博弈會(huì)存在更多的可能性;蛟S博弈論會(huì)給我們的生活帶來許多助益,但是是否有人愿意用博弈論來決定自己孩子的未來呢?比如,一場(chǎng)手術(shù)可能讓你生病的孩子完全治愈,也可能使他出現(xiàn)生命危險(xiǎn)。這個(gè)時(shí)候,你是否還會(huì)以博弈論來給出最終的判斷呢?對(duì)于這樣的問題,人們可能會(huì)永久地爭(zhēng)論下去,因?yàn)樗钡浆F(xiàn)在仍沒有答案;蛟S有人會(huì)說這是個(gè)哲學(xué)問題,所以不能用數(shù)學(xué)來予以解決。但是,在博弈論面前,如果你沒有規(guī)劃和尺度,你甚至無法成為它的觀眾。
《博弈論》一書既包含了博弈數(shù)學(xué)理論的細(xì)致說明,又包含了該理論多方面的應(yīng)用與實(shí)踐。博弈數(shù)學(xué)理論于1928年開始發(fā)展和出版,它主要應(yīng)用于博弈本身以及經(jīng)濟(jì)學(xué)和社會(huì)學(xué)問題。約翰·馮·諾依曼也希望用數(shù)學(xué)方法來研究這些問題。
如果想要應(yīng)用博弈論,我們至少要在所研究的簡(jiǎn)單博弈中印證這個(gè)理論,隨著約翰·馮·諾依曼研究的深入,其中的相互關(guān)系表現(xiàn)得愈加明顯。不過,對(duì)約翰·馮·諾依曼來說,博弈論的最終歸宿應(yīng)該在經(jīng)濟(jì)學(xué)和社會(huì)學(xué)上。他從一些簡(jiǎn)單博弈問題深入淺出地闡述了這個(gè)理論,盡管這些問題不如實(shí)際問題復(fù)雜,但它們都具有根本性和代表性,利用它們可以進(jìn)一步證明:不管是平行利益問題和相反利益問題、完全信息問題和不完全信息問題,還是自由合理的決定、機(jī)會(huì)影響問題,等等,都能夠用一個(gè)精確的方法來加以解決。