關(guān)于我們
書單推薦
新書推薦
|
合作的復(fù)雜性
阿克塞爾羅德主持的“囚徒困境重復(fù)博弈計(jì)算機(jī)程序奧林匹克競(jìng)賽”在學(xué)術(shù)界無人不知。其試驗(yàn)結(jié)果,對(duì)當(dāng)代社會(huì)科學(xué)許多領(lǐng)域的傳統(tǒng)理念產(chǎn)生了廣發(fā)的影響和沖擊。在本書中,作者從其最初贏得全球聲譽(yù)的《合作的進(jìn)化》中“一報(bào)還一報(bào)”的簡(jiǎn)單模型策略中,細(xì)致地“復(fù)雜化”出更多豐富結(jié)論。作者在對(duì)“重復(fù)囚徒困境博弈”試驗(yàn)結(jié)果的理論意義和所引發(fā)問題進(jìn)行具體討論的基礎(chǔ)上,側(cè)重于研究博弈中的合作。書中設(shè)計(jì)了一個(gè)接近人類社會(huì)群體的現(xiàn)實(shí)情景,引入噪聲考量和博弈規(guī)則,利用計(jì)算機(jī)程序建模,進(jìn)行試驗(yàn),并在理論上分析可行性。作者把模型從外生偏好假設(shè)中解放出來,這將為社會(huì)科學(xué)的進(jìn)步掃除很多障礙。
人與人之間的合作,是人類文明社會(huì)的基礎(chǔ)。在對(duì)人類合作生發(fā)機(jī)制及其道德基礎(chǔ)的理論探源方面,阿克塞爾羅德教授及其合作者們的研究已經(jīng)取得了豐碩的成果,并對(duì)經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)、人類學(xué)、倫理學(xué)、法學(xué),甚至生物學(xué)等學(xué)科產(chǎn)生了廣泛且深遠(yuǎn)的影響。這種“重復(fù)囚徒困境計(jì)算機(jī)程序博弈競(jìng)賽”,已把人類合作機(jī)制的一些模糊的經(jīng)驗(yàn)感悟和直觀猜測(cè)(如中文諺語(yǔ)“善有善報(bào)惡有惡報(bào),不是不報(bào)時(shí)候未到),現(xiàn)在已經(jīng)成了計(jì)算模型所證實(shí)的精確計(jì)算結(jié)果,這顯然是人類認(rèn)識(shí)史上的一個(gè)巨大理論進(jìn)步。因?yàn),這一研究不僅對(duì)經(jīng)濟(jì)學(xué)和政治學(xué)中的社會(huì)選擇理論有著重要的理論意義,而且對(duì)倫理學(xué)或道德哲學(xué),也提出了一些值得深思的問題。從本書的研究中,每個(gè)處在現(xiàn)代社會(huì)的理性的個(gè)人,都可以從中學(xué)到一些如何做人和如何進(jìn)行社會(huì)選擇的道理,或起碼可以從中獲得某些啟示。
從合作的進(jìn)化到合作的復(fù)雜性
一、引言 在當(dāng)代經(jīng)濟(jì)學(xué)、政治學(xué)、倫理學(xué)、人類學(xué)和其他社會(huì)科學(xué)中,甚至在生物學(xué)和其他自然科學(xué)中,阿克塞爾羅德(Robert Axelrod)教授的“重復(fù)囚徒困境博弈計(jì)算機(jī)程序奧林匹克競(jìng)賽”,已經(jīng)是一件很少人不知曉的理論佳話了。其試驗(yàn)結(jié)果,不僅對(duì)當(dāng)代社會(huì)科學(xué)的許多領(lǐng)域的傳統(tǒng)理念都產(chǎn)生了廣泛影響和沖擊,而且從中引發(fā)出來的一系列問題,迄今仍待學(xué)術(shù)各界進(jìn)一步探討和回答。 在具體展開討論由阿克塞爾羅德所主持設(shè)計(jì)的“重復(fù)囚徒困境博弈”試驗(yàn)結(jié)果的理論意義和所引發(fā)的問題之前,這里謹(jǐn)對(duì)本書作者做簡(jiǎn)要介紹。阿克塞爾羅德教授1964年獲芝加哥大學(xué)數(shù)學(xué)學(xué)士,1966年和1969年相繼從耶魯大學(xué)獲政治學(xué)碩士和博士學(xué)位。從耶魯大學(xué)畢業(yè)后,他曾在加州大學(xué)伯克利分校任教,并于1974年轉(zhuǎn)而在密歇根大學(xué)(the university of Michigan)執(zhí)教,現(xiàn)為密歇根大學(xué)政治系和福特公共政策學(xué)院的“沃爾格林人類理解研究講座教授”(the Walgreen professor for study of human understanding),以及“阿瑟?W.布羅米奇(ArthurW.Bromage)政治學(xué)與公共政策杰出教授”。阿克塞爾羅德的主要著作有:《利益沖突:歧異目標(biāo)理論以及在政治中的應(yīng)用》(1970),《認(rèn)知與選擇通論》(1972),《合作的進(jìn)化》(1984,這本著作已經(jīng)被翻譯為11種文字),《制服復(fù)雜性:從科學(xué)前沿來審視組織的意義》(2000),以及本書《合作的復(fù)雜性:基于參與者競(jìng)爭(zhēng)與合作的模型》(1997,這本書也已經(jīng)被翻譯為日文、韓文、西班牙文等多國(guó)文字)。除此之外,阿克塞爾羅德教授還有數(shù)十篇學(xué)術(shù)論文發(fā)表在國(guó)際學(xué)術(shù)期刊或已經(jīng)出版的文集中。 在上述著作中,最為國(guó)際學(xué)術(shù)界所熟知的還是其《合作的進(jìn)化》這部名著,而本書則是《合作的進(jìn)化》的續(xù)篇和補(bǔ)充。 二、問題的提出:人類群體是如何達(dá)致合作的? 人類社會(huì)與其他動(dòng)物群體的一個(gè)重要區(qū)別是,人與人之間可以通過運(yùn)用個(gè)人理性而達(dá)致某種形式的合作(我這里所說的合作,包括諸如勞動(dòng)與社會(huì)分工、專業(yè)化,市場(chǎng)交易,合伙和共同經(jīng)營(yíng)企業(yè),以及在經(jīng)濟(jì)組織、社會(huì)團(tuán)體、政黨、政治聯(lián)盟、各種民間和公益團(tuán)體中人們的相互協(xié)作、交往和協(xié)調(diào)行動(dòng),等等)。合作,能產(chǎn)生“合作剩余”,這應(yīng)該是經(jīng)濟(jì)學(xué)的一個(gè)常識(shí)——盡管沒有多少經(jīng)濟(jì)學(xué)教科書真正講“合作剩余”這個(gè)概念(Moulin,1995)。人類的相互交往,用現(xiàn)代比較時(shí)尚的博弈論術(shù)語(yǔ)講,就是在玩一種“社會(huì)博弈”。在人類社會(huì)的博弈中,常常會(huì)出現(xiàn)一種叫“囚徒困境”的博弈格局。囚徒困境博弈格局表明,若依照當(dāng)代主流經(jīng)濟(jì)學(xué)的理論推理假設(shè),有著超理性(hyper rational)的最大化推理的博弈者(players)在許多博弈格局中——按照博弈論中的“無名氏定理”(the Folk Theorem),即使是在有限重復(fù)囚徒困境博弈中——也是無法達(dá)致合作或言帕累托效率的。 然而,博弈論和經(jīng)濟(jì)學(xué)的理論預(yù)測(cè)是如此,但現(xiàn)實(shí)情形卻是,在任何人類文明社會(huì)中,在人與人之間總是存在這樣和那樣形式的合作,因而阿克塞爾羅德(Axelrod,1984;羅伯特?阿克塞爾羅德,2007年,第3頁(yè))曾認(rèn)為:“合作現(xiàn)象四處可見,它是文明的基礎(chǔ)。”這樣就出現(xiàn)了一個(gè)經(jīng)濟(jì)社會(huì)理論所必須回答的問題:在每個(gè)人都具有自私動(dòng)機(jī)的情況下,人們?cè)鯓硬拍芡ㄟ^社會(huì)博弈而自發(fā)產(chǎn)生合作?換言之,人類合作能否從有著自己利益最大化推理邏輯的行動(dòng)者的行為互動(dòng)中自發(fā)產(chǎn)生?或更直接一點(diǎn)說,人們到底是如何跳出這處處存在且沒完沒了的種種“囚徒困境”迷局的? 從人類經(jīng)濟(jì)社會(huì)思想史的理論進(jìn)展來看,盡管“囚徒困境博弈”的理論程式到1950年才被人們?cè)O(shè)計(jì)出來,但如何克服個(gè)人短期和眼前的私利而通過合作最大化人類的社會(huì)福祉這一問題,卻在很早就被各學(xué)科的一些重要思想家們認(rèn)識(shí)到并且提了出來。從西方社會(huì)思想史來看,在這方面最為人們所熟知的例子是霍布斯(Thomas Hobbes,1943)的“利維坦”和盧梭(Jean JacquesRousseau,1968)的“社會(huì)契約理論”。按照霍布斯的理論思路,沒有一個(gè)作為利維坦的機(jī)構(gòu)(可大致理解為“作為國(guó)家政府的集權(quán)體制機(jī)構(gòu)”),人類合作將是不可能產(chǎn)生的,因此,一個(gè)強(qiáng)權(quán)的政府機(jī)構(gòu)是必要的。而按照盧梭的理論路徑,一些自由人之間相互交往會(huì)產(chǎn)生“公意”(general will),在公意存在的情況下,通過某種“社會(huì)契約”,就可以達(dá)致并維持某種人類社會(huì)或社群之間的某種合作。 然而,問題到這里并沒有結(jié)束。即使我們同意作為一個(gè)巨大利維坦的政府機(jī)構(gòu)對(duì)促進(jìn)社會(huì)合作有某種作用,但是反過來的問題是:如何避免一個(gè)龐大的政府官僚科層制所可能帶來的效率損失?于是,通過霍布斯的利維坦形式而達(dá)致的社會(huì)合作,就有一個(gè)通過這種方式所達(dá)致的“合作剩余”與官僚科層制可能帶來的“效率耗散”的替代關(guān)系。 盧梭的社會(huì)契約論,就其本質(zhì)而論,也是想解決人類社會(huì)的合作問題,但盧梭的政治主張和理論路徑,也不是沒有問題的。這里尤為值得指出的是,盡管盧梭批評(píng)了霍布斯的君主專制主張,提出在人類最初處于“自然狀態(tài)”時(shí)是人人自由平等的這種天賦人權(quán)觀,并主張?jiān)诖死碚摶A(chǔ)上通過自由人的公意簽立契約而建立國(guó)家,設(shè)立政府,并在政府的治理之下實(shí)現(xiàn)社會(huì)合作,但盧梭的社會(huì)理論本身卻以共和制為形式的專制獨(dú)裁的理論為導(dǎo)向,從而在現(xiàn)實(shí)中,受盧梭和其他法國(guó)啟蒙思想家的社會(huì)哲學(xué)和政治主張的影響,法國(guó)在18世紀(jì)末和19世紀(jì)上半葉也確實(shí)發(fā)生了一場(chǎng)場(chǎng)腥風(fēng)血雨的大革命。今天究其理論邏輯,我們會(huì)發(fā)現(xiàn),按照盧梭的政治理論,集體意志(公意)是維系契約社會(huì)的紐帶,沒有對(duì)公共利益的維護(hù),沒有集體意志(公意)的運(yùn)用,契約就等于一紙空文,人類社會(huì)的合作也難以發(fā)生和存續(xù),由此盧梭認(rèn)為,公民有義務(wù)把公意看成是自己的意志。在此情況下,若有任何人拒不服從公意,全體就要逼迫他服從公意。因而,根據(jù)盧梭的人民主權(quán)論的這一邏輯推理,如果某個(gè)人或某個(gè)組織代表公意,那么這個(gè)人或組織就有權(quán)力來統(tǒng)馭、控制和指導(dǎo)整個(gè)社會(huì)。這樣一來,一種代表公意的專制集權(quán)統(tǒng)治就自然而然地內(nèi)在于這一政治推理邏輯之中了。由此看來,與其說盧梭的社會(huì)契約論是想達(dá)致在人人自愿基礎(chǔ)上的某種社會(huì)合作,而毋寧說他是主張一些人以“集體理性”和“社會(huì)公意”為名義實(shí)行個(gè)人的專制獨(dú)裁。就此而論,盡管盧梭從詞語(yǔ)上不同意霍布斯的君主專制政體主張,但在通過控制社會(huì)來強(qiáng)制人們進(jìn)行某種社會(huì)選擇這一問題上,二者卻可謂是殊途同歸。 概言之,從霍布斯到盧梭,西方古典社會(huì)契約論的一個(gè)基本理論假設(shè)是,一個(gè)具有共同利益的群體會(huì)在某種外在強(qiáng)制力量和社會(huì)安排下為實(shí)現(xiàn)共同利益而采取集體行動(dòng),并且這要么導(dǎo)致君主專制,要么達(dá)致共和獨(dú)裁。然而,這是人類社會(huì)所命定的必然選擇嗎?人類是否必須接受霍布斯的“利維坦”或盧梭的“人民主權(quán)者”的專制統(tǒng)治,并只有在此統(tǒng)治之下才能實(shí)現(xiàn)某種形式的社會(huì)合作?換句話說,哈耶克(Hayek,1988)在《致命的自負(fù)》一書中所提出的人類合作的擴(kuò)展秩序(the extended order of human cooperation)能否自發(fā)生成和自然成長(zhǎng)?如果能,其自發(fā)生成和自然擴(kuò)展的外在條件和社會(huì)機(jī)制又是什么?這些問題追問到最后,都會(huì)牽涉到人類內(nèi)部——或具體到個(gè)人之間——合作的原初發(fā)生機(jī)制和維系機(jī)理問題。從這個(gè)角度來審視問題,今天我們也許會(huì)發(fā)現(xiàn),在20世紀(jì)由美國(guó)著名經(jīng)濟(jì)學(xué)家曼瑟爾?奧爾森(Mancur Olson)所詰問的人類社會(huì)的“集體行動(dòng)的邏輯”,實(shí)際上是把人類合作如何可能這類霍布斯和盧梭式的老問題,在現(xiàn)代社會(huì)科學(xué)的話語(yǔ)語(yǔ)境中重新提了出來,并把它還原到人與人之間的個(gè)人博弈的層面上來進(jìn)行考察。 這里不妨讓我們?cè)俸?jiǎn)單回顧一下奧爾森的集體行動(dòng)的邏輯。奧爾森認(rèn)為,每一個(gè)個(gè)人都是理性的“經(jīng)濟(jì)人”,個(gè)人不僅在個(gè)體活動(dòng)中,而且在集體活動(dòng)中,其目的都只有一個(gè),那就是不斷追求個(gè)人利益的最大化。正是由于這種個(gè)人的自利傾向,使得集體行動(dòng)在大的集團(tuán)中成為一種不可能的事。因?yàn),集團(tuán)越大,就越難克服集體行動(dòng)中的“搭便車”行為:人人都想分享集體行動(dòng)的成果,但不愿分擔(dān)集體行動(dòng)的成本。奧爾森集體行動(dòng)的邏輯所面臨的問題,顯然也是人類社會(huì)中經(jīng)常且時(shí)時(shí)存在的多人囚徒困境博弈中眾人的“合作選擇”如何成為可能的問題。面對(duì)這個(gè)古老、簡(jiǎn)單而似乎又萬古常新的理論問題,奧爾森的推理邏輯如此單刀直入?yún)s又不乏深刻:“除非一個(gè)集團(tuán)中人數(shù)很少,或者除非存在強(qiáng)制或其他某些特殊手段以使個(gè)人按照他們的共同利益行事,有理性的、尋求自我利益的個(gè)人不會(huì)采取行動(dòng)以實(shí)現(xiàn)他們共同的或集團(tuán)的利益!(Olson,1980;曼瑟爾?奧爾森,1995年,第2頁(yè))很顯然,奧爾森只不過是在20世紀(jì)復(fù)述了一遍霍布斯和盧梭所提出的老問題。 霍布斯和盧梭的思想,以及后來奧爾森的工作,在人類思想史上無疑均有重要的歷史意義,且在人類數(shù)百年的現(xiàn)代化進(jìn)程中,霍布斯的利維坦和盧梭的社會(huì)契約論,均能在歐洲社會(huì)的歷史上存在過的政治和社會(huì)體制中發(fā)現(xiàn)其理論的現(xiàn)實(shí)體現(xiàn)(incarnation)。然而,人類社會(huì)的合作,遠(yuǎn)比這兩位古典政治哲學(xué)家眼中的政治體制問題要寬泛得多。從國(guó)與國(guó)之間的軍備競(jìng)賽、國(guó)際貿(mào)易、關(guān)稅協(xié)定的制定和恪守,到商家雙頭(duopoly)和多頭(oligopoly)競(jìng)爭(zhēng)、合伙制與現(xiàn)代科層制公司內(nèi)部的運(yùn)作和管理、公共物品的提供,再到鄰里相處、朋友相交、夫妻之道、家庭維系……這時(shí)時(shí)、處處、事事似乎都充滿著超越囚徒困境博弈的合作選擇問題,以至于可以認(rèn)為,沒有人與人之間的合作,沒有人們對(duì)單次或重復(fù)囚徒困境博弈均衡選擇的超越,就沒有人類的文明社會(huì)。但是,反過來說,沒有人們面臨諸種囚徒困境博弈格局中的“均衡”選擇,即“背叛”,人類社會(huì)中的國(guó)家、法律、禮俗、規(guī)范、組織和種種制度,在很大程度上也就成為多余的了。那么,人類社會(huì)究竟是如何在一些囚徒困境博弈的格局中達(dá)致相互合作的?在面臨著隨時(shí)出現(xiàn)的囚徒困境博弈格局時(shí),作為一個(gè)理性(包括康德哲學(xué)意義上的純粹理性和實(shí)踐理性,或更確切說,即包括新古典主流經(jīng)濟(jì)學(xué)理論話語(yǔ)中的個(gè)人利益和效用的最大化的理性行為,也包括休謨、斯密和康德道德哲學(xué)中的道德情感和定言命令)的行動(dòng)者,在面臨著一個(gè)又一個(gè)的重復(fù)和不重復(fù)囚徒困境博弈格局時(shí),對(duì)你來說最好的選擇是什么?或言你應(yīng)該如何選擇? 這種種問題,既是些理論問題,也是些現(xiàn)實(shí)問題;既是牽涉到人類社群組織和社會(huì)政制的深層發(fā)生機(jī)制和原理,也牽涉到個(gè)人層面的道德標(biāo)準(zhǔn)和個(gè)人選擇的優(yōu)化問題。這一系列看似簡(jiǎn)單但實(shí)際上又十分復(fù)雜、且看似表層但實(shí)際上是社會(huì)和社群構(gòu)成基礎(chǔ)的深層問題,就被阿克塞爾羅德在20世紀(jì)80年代連續(xù)設(shè)計(jì)進(jìn)行的三次“囚徒困境重復(fù)博弈計(jì)算機(jī)程序奧林匹克競(jìng)賽”所充分展示出來了。 三、阿克塞爾羅德“囚徒困境重復(fù)博弈計(jì)算機(jī)程序奧林匹克競(jìng)賽”結(jié)果及理論意義 這里,首先讓我們介紹一下阿克塞爾羅德所指導(dǎo)進(jìn)行的三次重復(fù)囚徒困境博弈實(shí)驗(yàn)的模型設(shè)計(jì)和試驗(yàn)結(jié)果,然后再綜合評(píng)價(jià)這三屆博弈實(shí)驗(yàn)結(jié)果的理論意義。在下一小節(jié)中,我們?cè)賮碛懻摪⒖巳麪柫_德的《合作的復(fù)雜性》這本著作的主要理論貢獻(xiàn)及其現(xiàn)實(shí)意義。 稍熟悉現(xiàn)代博弈論的讀者會(huì)知道,囚徒困境(thePrisonerDilemma,簡(jiǎn)稱“PD”)一般有以下簡(jiǎn)單直觀的形式: C(合作)D(背叛) C(合作)R,R S,T D(背叛)T,S P,P 圖1囚徒困境博弈的一般形式 其中,按照英文字符所代表的縮略詞的一般意義來解釋:R,對(duì)博弈雙方合作的報(bào)酬支付報(bào)酬(reward for mutual cooperation);T,博弈者采取背叛策略的誘惑(temptation to defect);S,對(duì)策略選擇中自己采取合作策略,而對(duì)方采取背叛策略的“愚蠢策略”(sucker spayoff)的回報(bào);P,對(duì)雙方背叛的懲罰(punishment for mutual defection)。根據(jù)上述定義,囚徒困境博弈的一般方程式為:PD=T>R>P>S。根據(jù)囚徒困境的這種一般形式,為了簡(jiǎn)便計(jì)算,阿克塞爾羅德為其博弈競(jìng)賽設(shè)計(jì)了一個(gè)如圖2所示的有限次重復(fù)博弈的支付矩陣。 策略i C(合作) D(背叛) 策略j C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1 圖2阿克塞爾羅德重復(fù)囚徒困境博弈支付矩陣 設(shè)計(jì)好了這個(gè)支付矩陣后,阿克塞爾羅德為他的整個(gè)重復(fù)囚徒困境博弈奧林匹克錦標(biāo)賽的目標(biāo)設(shè)計(jì)了這樣一個(gè)標(biāo)準(zhǔn):找出在這種重復(fù)囚徒困境博弈“錦標(biāo)賽”中哪種策略是最好的(即能收到的總支付最大)。為了達(dá)到這一點(diǎn),阿克塞爾羅德想出了一個(gè)聰明的辦法,就是向博弈論專家們發(fā)出廣告,讓有興趣參賽的博弈論專家和一些社會(huì)科學(xué)家各自設(shè)計(jì)一種自認(rèn)為是最好的策略,來參加他的“博弈策略”比賽。在第一次實(shí)驗(yàn)中,阿克塞爾羅德共收到14個(gè)“策略參賽者”。為了便于評(píng)判,阿克塞爾羅德增加了自己的第15個(gè)策略程序“隨機(jī)策略”,也就是“沒有策略的策略”:隨機(jī)地出“合作”(C)和“背叛”(D)牌。阿克塞爾羅德還把他的“隨機(jī)策略”作為“比賽”的底線。因?yàn),如果有哪一個(gè)策略比“隨機(jī)策略”的總得分還差,那一定是糟糕透了的策略。 在決定這15個(gè)參賽策略后,阿克塞爾羅德把它們都轉(zhuǎn)換成同一種電腦語(yǔ)言并在一臺(tái)大型計(jì)算機(jī)中讓它們一一對(duì)壘。既然有15種策略,就有225場(chǎng)“比賽”,其中包括每個(gè)策略程序也與自己對(duì)壘(同一種策略程序?qū)?。阿克塞爾羅德還讓每場(chǎng)“比賽”玩200個(gè)回合。通過這225場(chǎng)200個(gè)回合的博弈“比賽”,看哪一個(gè)策略參賽者能獲得的支付最多。如圖2所示,支付的點(diǎn)數(shù)是這樣計(jì)算的:在每次博弈中,相互合作(C,C),得支付R=3;此方背叛對(duì)方合作(D,C),得T=5;互相背叛(D,D),雙方都受到懲罰,得P=1;此方合作對(duì)方背叛(C,D),得被欺騙的回報(bào)S=0。在此博弈弈局安排中,理論上只有一種策略組合能達(dá)15000分,那就是15場(chǎng)200個(gè)回合的比賽全是(D,C)(每個(gè)回合全得T=5分)。反過來,如全部(C,D),得最低總分S=0。但這兩個(gè)極端不會(huì)發(fā)生。因?yàn)闆]有一個(gè)策略會(huì)在對(duì)方全出背叛牌(D)時(shí)而自己全出合作牌(C)。實(shí)際上,任何一種策略平均每場(chǎng)“比賽”所得支付不會(huì)超過600。這是兩個(gè)參賽程序在一場(chǎng)200個(gè)回合對(duì)抗賽中全出合作牌(C,C)自己所能得的分?jǐn)?shù)。所以,阿克塞爾羅德把600分作為基準(zhǔn)分,而將所有參賽策略的比賽成績(jī)換算成這一分?jǐn)?shù)的百分比。 由于阿克塞爾羅德的“重復(fù)囚徒困境博弈”比賽的參賽程序全由博弈論專家所提供,有些參賽程序看來設(shè)計(jì)得非常精明。但是,令人出乎預(yù)料的是,第一屆博弈對(duì)抗賽的冠軍竟是在所有策略中最簡(jiǎn)單(除了阿克塞爾羅德本人的“隨機(jī)策略”外)且表面上看來非!昂┲薄钡摹耙粓(bào)還一報(bào)”(tit for tat,簡(jiǎn)稱“TFT”)策略。這個(gè)策略是由加拿大多倫多大學(xué)的著名博弈論心理學(xué)家阿納托爾?拉波波特(Anatol Rapoport)教授提供的!耙粓(bào)還一報(bào)”策略非常簡(jiǎn)單:第一回合取“合作”,然后每一回合都重復(fù)對(duì)手的上一回合的策略。 阿克塞爾羅德第一屆“重復(fù)囚徒困境博弈”比賽的結(jié)果出來了:“一報(bào)還一報(bào)”得第一,平均得分504.5,即600基準(zhǔn)分的84%。其他8個(gè)好的策略中,得基準(zhǔn)分介于28.6%和83.4%之間。令人跌破眼鏡的是,在阿克塞爾羅德的第一次“博弈比賽”中,最失敗的就是最復(fù)雜的那一個(gè)策略。 為什么簡(jiǎn)單平直的“一報(bào)還一報(bào)”策略會(huì)獲勝?道理似乎很復(fù)雜,也似乎很簡(jiǎn)單。當(dāng)遇到“合作對(duì)手”時(shí),它永遠(yuǎn)合作。即使遇到同類“一報(bào)還一報(bào)”時(shí),由于大家都是從合作開始,也就保持了永遠(yuǎn)合作,故所得“合作剩余”也總是最高。當(dāng)“一報(bào)還一報(bào)”遇到“狡詐的”策略程序時(shí),你怎么來,我就怎么往,一報(bào)還一報(bào),故也不會(huì)比你差。從中,阿克塞爾羅德得出一個(gè)基本結(jié)論:好的策略的標(biāo)準(zhǔn)是永遠(yuǎn)不先背叛!耙粓(bào)還一報(bào)”就是一個(gè)例子。它會(huì)背叛,但只是在報(bào)復(fù)時(shí)才如此。這似乎令人相信,“善于合作的好人”在社會(huì)博弈的長(zhǎng)期比賽中得分結(jié)果會(huì)很好,而不管遇到的博弈對(duì)手是“善良型”的,還是“詭詐型”的。阿克塞爾羅德的第一屆博弈大賽也表明,好的策略必須有三個(gè)特征:“善良”、“寬恕”和“不嫉妒”。所謂“善良”,就是從不主動(dòng)地先背叛。所謂“寬恕”,就是指很容易忘卻對(duì)方過去的“錯(cuò)誤”。一旦對(duì)方“改過”,即以合作對(duì)待。這兩點(diǎn)“一報(bào)還一報(bào)”均具備,故占這次博弈比賽的榜首。所謂“不嫉妒”,就是當(dāng)別的參賽者“賺”得和你一樣多時(shí),你仍然很高興,而且樂于同時(shí)從“莊家”那里贏錢。很顯然,“一報(bào)還一報(bào)”也是一種不嫉妒的策略。因?yàn),它從來沒有真正地贏過任何一場(chǎng)比賽。由于“一報(bào)還一報(bào)”從不先背叛,它從來沒有在任何一場(chǎng)比賽中比對(duì)手獲得的支付更高。它似乎傾向于與對(duì)手分享高分。相比之下,博弈論常識(shí)中由所謂“倒推法”所推出的“有限重復(fù)囚徒困境博弈不會(huì)產(chǎn)生合作,而只有無限重復(fù)的囚徒困境博弈才會(huì)產(chǎn)生合作”的“俗定理”,就是基于一種“嫉妒”心理而進(jìn)行推理的。因?yàn),它總是假定每個(gè)博弈者總想取得比對(duì)手更高的支付分?jǐn)?shù)。事實(shí)上,“俗定理”所展示的是最理性、最精明但也是“最愚蠢”(聰明反被聰明誤)的博弈推理。這種博弈推理所導(dǎo)致的重復(fù)囚徒困境博弈的比賽結(jié)果肯定是最差的,因?yàn)樗鼘?dǎo)致了永遠(yuǎn)背叛的策略對(duì)(D,D)。實(shí)際上,這種倒推推理的邏輯也表明,新古典和博弈論理性最大化理論陣營(yíng)所派出的博弈參賽者只是短視地看到它在與對(duì)手進(jìn)行博弈,而沒有意識(shí)到它是與對(duì)手一起在與“莊家”博弈。 在第一屆重復(fù)囚徒困境博弈對(duì)抗賽的結(jié)果出來之后,阿克塞爾羅德又組織了第二屆比賽。這次比賽他共收到62套策略程序,加上他的“沒有策略的策略”即“隨機(jī)策略”,共63套策略參賽。第二次,每局比賽也不再是每場(chǎng)200個(gè)回合了,而是更多,因而基準(zhǔn)分?jǐn)?shù)也不再是600了。在征集第二屆博弈對(duì)抗賽的參賽策略時(shí),阿克塞爾羅德還把第一屆比賽結(jié)果告訴了所有第二屆博弈對(duì)抗賽的參賽策略程序設(shè)計(jì)者,并附有他自己的分析,說明為什么善良及寬恕的策略會(huì)在第一屆博弈對(duì)抗賽中表現(xiàn)得如此優(yōu)秀。但第二屆博弈對(duì)抗賽的策略設(shè)計(jì)者們?cè)谑盏降谝粚脤?duì)抗賽的結(jié)果和阿克塞爾羅德的說明后,在設(shè)計(jì)他們的新參賽策略時(shí)有兩種思路。一派博弈論專家根據(jù)“善有善報(bào)”推理送來了善良且寬恕的策略。著名的生物學(xué)家、演化博弈論的奠基人約翰?梅納德?史密斯(John Maynard Smith)甚至還送來“超級(jí)寬恕”程序“兩怨還一報(bào)”的策略。另一派專家則推想到大多數(shù)同仁會(huì)進(jìn)一步提供善良和寬厚的策略而反其道而行之,設(shè)計(jì)出更加“細(xì)膩”、“精明”、“狡詐”和“不友善”的策略,以旨在“整整”這些來參賽的“愚笨好人(策略)”。 然而,第二屆對(duì)抗賽結(jié)果出來了:狡詐的策略再度失敗,阿納托爾?拉波波特的“一報(bào)還一報(bào)”策略再度獲勝,并且得了基準(zhǔn)得分的96%。而且,“善良”的策略再次普遍表現(xiàn)得比“狡詐”的策略好。在前15名中只有一個(gè)不是“善良”的策略,最后15名中只有一個(gè)不是“狡詐”策略。不過,史密斯的“兩怨還一報(bào)”策略在這一屆博弈對(duì)抗賽沒有贏。這可能是因?yàn)樗^于“善良”和“寬厚”因而被那些“精明”而“詭詐”的策略所“無情捕殺”。阿克塞爾羅德從第二屆博弈對(duì)抗賽中甚至還發(fā)現(xiàn),“一報(bào)還一報(bào)”這一“善良”、“憨直”的策略之所以獲勝,是因?yàn)閰⒓拥诙䦟貌┺膶?duì)抗賽的策略大部分是“善良型”的。他還推斷到,如果參賽的其他62個(gè)策略全是“詭詐型”的,“一報(bào)還一報(bào)”策略可能就不會(huì)贏了。因?yàn),它也?huì)像史密斯的更加“善良”和“寬厚”的“兩怨還一報(bào)”策略一樣被狡詐的策略“群狼”所“捕殺”。 事實(shí)上,阿克塞爾羅德后來又進(jìn)行了他的第三屆“重復(fù)囚徒困境博弈對(duì)抗賽”。但這次他并沒有征集新的策略,而是在改變電腦程序后,讓第二屆的所有參賽策略重新進(jìn)行比賽。在第三屆對(duì)抗賽中,阿克塞爾羅德主要沿著演化博弈(或譯進(jìn)化博弈)的理論思路,想從對(duì)抗賽中找出史密斯的“演化穩(wěn)定策略”(Evolutionary Stable Strategies,ESSs)。為了達(dá)到這一目的,阿克塞爾羅德先將63套策略程序存入電腦,讓其作為演化博弈的第一代。在第一代之間的對(duì)抗賽結(jié)束時(shí),每一種策略的勝利不是由所得分?jǐn)?shù)來評(píng)判,而是根據(jù)由每種策略產(chǎn)生多少“后代”來決定。當(dāng)一個(gè)子代生成后,有些策略逐步變得稀少起來,有些甚至完全消失了,而其他策略則變得多了起來。經(jīng)過1000代,策略的比例和環(huán)境都不再改變而達(dá)到了一定程度的穩(wěn)定。第三屆“重復(fù)囚徒困境演化博弈”的實(shí)驗(yàn)結(jié)果表明,幾乎所有“詭詐型”策略都在200代左右完全消失了!耙粓(bào)還一報(bào)”策略仍然在第三屆演化博弈比賽中表現(xiàn)得很出色。其他5種“善良而不懦弱”的策略也和“一報(bào)還一報(bào)”同樣成功。阿克塞爾羅德最后還發(fā)現(xiàn),當(dāng)演化博弈競(jìng)賽中所有“詭詐”策略都絕跡后,已無法區(qū)分“一報(bào)還一報(bào)”和別的“善良型”策略,也無法區(qū)別出任何兩種競(jìng)賽策略之間的差異了。因?yàn),他們(nèi)恰吧屏肌毙偷模粗粫?huì)向?qū)Ψ匠觥昂献髋啤。?duì)于這一演化博弈結(jié)果,生物學(xué)家道金斯(Dawkins,1989,p.233)感慨地歸納道:“即使有自私的基因掌權(quán)控制,好人仍能得好報(bào)!” …… 韋森2007年9月于復(fù)旦大學(xué)
羅伯特·阿克塞爾羅德,密歇根大學(xué)政治學(xué)與公共政策教授,美國(guó)科學(xué)院院士,著名的行為分析與博弈論專家,主要由于他在博弈論和復(fù)雜性理論上的基礎(chǔ)性突破而廣為人知。阿克塞爾羅德是把計(jì)算機(jī)模型運(yùn)用到社會(huì)科學(xué)問題領(lǐng)域的資深學(xué)者。作者受到過來自美國(guó)科學(xué)促進(jìn)會(huì)、美國(guó)政治科學(xué)協(xié)會(huì)、麥克阿瑟基金會(huì)以及美國(guó)國(guó)家科學(xué)院的獎(jiǎng)勵(lì)。除本書外,還著有《合作的進(jìn)化》等著作。
從合作的進(jìn)化到合作的復(fù)雜性/1
英文版前言/1 導(dǎo)論/1 第一章演化新策略/9 第二章處理噪音/30 第三章發(fā)展規(guī)范/42 第四章選擇陣營(yíng)/72 第五章設(shè)定標(biāo)準(zhǔn)/99 第六章建構(gòu)新的政治行動(dòng)者/128 第七章文化的散布/154 附錄A 復(fù)制基于參與者模型/189 附錄B 基于參與者模型的學(xué)習(xí)指引/215 譯后記/234
預(yù)測(cè)第二次世界大戰(zhàn)中歐洲的聯(lián)盟
就國(guó)際關(guān)系而言,聚合問題通常就是指聯(lián)盟問題。解釋國(guó)際聯(lián)盟的主要思路是:國(guó)家之所以要組成聯(lián)盟,主要是為了抵御其他強(qiáng)權(quán)國(guó)家的侵略。根據(jù)這種現(xiàn)實(shí)主義的范式,國(guó)家的平衡行為是在一個(gè)無政府主義的國(guó)際系統(tǒng)中展開的,每個(gè)國(guó)家都把他國(guó)看作自己的敵人。在地形理論中,這就意味著所有的傾向值都相等,且為負(fù)。在此基礎(chǔ)上,該理論再預(yù)測(cè)出一種穩(wěn)定的聯(lián)盟格局,其中對(duì)抗的雙方在規(guī)模上達(dá)到平衡。這個(gè)預(yù)測(cè)格局之所以具有穩(wěn)定性,是因?yàn)樘幱诰植磕芰孔畹忘c(diǎn)。如果把規(guī)模換成權(quán)力,在現(xiàn)實(shí)主義假設(shè)下,可以準(zhǔn)確地說,地形理論所預(yù)測(cè)的就是權(quán)力聯(lián)盟之間的平衡結(jié)果。 事實(shí)上,當(dāng)國(guó)家進(jìn)行有關(guān)聯(lián)盟的抉擇時(shí),它們所考慮的決不僅僅是權(quán)力問題。斯蒂芬·沃爾特(Stephen Walt)的新現(xiàn)實(shí)主義認(rèn)為,國(guó)家會(huì)在多種威脅之間進(jìn)行平衡。格倫·斯奈德(Glenn Snyder)則指出,國(guó)家可能有某些興趣偏向會(huì)影響到它對(duì)于其他所有國(guó)家的行為,比如希望獲得軍事保護(hù),不過,它和具體的某一個(gè)國(guó)家之間也有個(gè)別的沖突或喜好,這可能來自于意識(shí)形態(tài)、種族、經(jīng)濟(jì)或者威望等層面。這種“普遍興趣”和“特殊興趣”在國(guó)與國(guó)之間建立起了一種“默契的聯(lián)盟”。把這些興趣與新現(xiàn)實(shí)主義的范式結(jié)合在一起,可以認(rèn)為,斯奈德的“沖突和共同點(diǎn)”正是一國(guó)從他國(guó)感受到的威脅的來源。喬治·利斯卡(George Liska)進(jìn)一步聯(lián)想到,意識(shí)形態(tài)和歷史基礎(chǔ)很可能已經(jīng)預(yù)設(shè)了“理性的”聯(lián)盟選擇。事實(shí)上,聯(lián)盟選擇既取決于權(quán)力又取決于興趣的看法在學(xué)者中并不少見。 不幸的是,此前還沒有哪個(gè)一致的聯(lián)盟模型將個(gè)別的興趣和喜好整合進(jìn)來。對(duì)于這種整合,地形理論的做法是將多種多樣的興趣放在一個(gè)單一的傾向概念里面,然后再把它和規(guī)模(權(quán)力)結(jié)合起來,二者共同決定最后的結(jié)果。 地形理論還能克服對(duì)于某些領(lǐng)導(dǎo)聯(lián)盟研究的局限。此類研究專注于單個(gè)國(guó)家的抉擇,因而無法預(yù)測(cè)聯(lián)盟聚合的整體形式。但地形理論能夠明確地把在降低受挫感直至到達(dá)局部最低點(diǎn)的過程中國(guó)家行動(dòng)的秩序都考慮進(jìn)來,從而解決預(yù)測(cè)聯(lián)盟聚合的整體格局的難題。 接下來,我們開始從國(guó)際聯(lián)盟問題入手運(yùn)行和檢驗(yàn)地形理論。其實(shí)不管運(yùn)用到哪一個(gè)領(lǐng)域中去,地形理論的運(yùn)行和檢驗(yàn)都要求回答四個(gè)問題: 1.行動(dòng)者是誰(shuí)? 2.他們的規(guī)模如何? 3.每一對(duì)行動(dòng)者之間的傾向是怎樣? 4.實(shí)際的結(jié)果是什么? 這四個(gè)問題的答案取決于要考察的具體領(lǐng)域。因?yàn)榇颂幬覀兯M(jìn)行的是在國(guó)際聯(lián)盟問題上運(yùn)行和檢驗(yàn)地形理論,所以可以引第二次世界大戰(zhàn)以前的歐洲為例。即使我們假定行動(dòng)者只能是個(gè)聯(lián)盟格局中的任一方里的一員,這個(gè)案例仍然能說明問題。隨著戰(zhàn)爭(zhēng)越來越臨近,國(guó)家開始漸漸被劃分為對(duì)立的兩組,如華爾茲(Waltz)所說:“只有當(dāng)權(quán)力政治的博弈真的十分艱難時(shí),參與者才會(huì)形成兩個(gè)敵對(duì)的陣營(yíng)。因?yàn)橐_(dá)成并維持聯(lián)盟實(shí)在是一項(xiàng)萬般復(fù)雜的工程,只有戰(zhàn)爭(zhēng)高壓迫使政治博弈達(dá)到難分高下的地步才會(huì)導(dǎo)致如此的結(jié)果。”這項(xiàng)檢驗(yàn)的目標(biāo)是預(yù)測(cè)戰(zhàn)爭(zhēng)期間實(shí)際形成的國(guó)家聯(lián)盟格局,選擇的行動(dòng)者是20世紀(jì)30年代參與了主要的外交活動(dòng)的17個(gè)歐洲國(guó)家。每個(gè)國(guó)家的規(guī)模用戰(zhàn)爭(zhēng)相關(guān)數(shù)據(jù)庫(kù)(Correlates of War project)中的國(guó)家實(shí)力指數(shù)來衡量,該指數(shù)由人口、工業(yè)和戰(zhàn)爭(zhēng)能力等6個(gè)因素合成。 如前所述,權(quán)力并不是國(guó)家在進(jìn)行聯(lián)盟抉擇時(shí)考慮的唯一因素。但是,雖然現(xiàn)有研究對(duì)于權(quán)力已經(jīng)有了深入的分析,卻沒有現(xiàn)成的針對(duì)國(guó)家興趣的分類定義法能讓我們編制出一個(gè)以興趣為基礎(chǔ)的傾向指標(biāo)來。于是我們只能嘗試著自己創(chuàng)造一種分類定義法,即把兩國(guó)之間的興趣分為種族、宗教、領(lǐng)土、意識(shí)形態(tài)、經(jīng)濟(jì)和歷史關(guān)系。我們有理由認(rèn)為,這種分類定義法已經(jīng)包含了國(guó)家間相同點(diǎn)和不同點(diǎn)的主要可能,因?yàn)樗鼈兌紩?huì)影響到國(guó)家的戰(zhàn)略決策。具體地說,在被考察的國(guó)家中,我們會(huì)考察每一對(duì)之間的種族沖突狀況、人民宗教信仰的相似程度、邊界分歧的現(xiàn)狀、統(tǒng)治類型的相似性以及二者近來是否發(fā)生過戰(zhàn)爭(zhēng)。然后把這5種因素的權(quán)重組合在一起,就可以作為衡量每對(duì)國(guó)家之間的合作傾向的指標(biāo)。有了以上的衡量規(guī)模和傾向的方法,我們便能夠計(jì)算出65536種可能的格局中每一種的能量值。 我們要預(yù)測(cè)的是在第二次世界大戰(zhàn)期間每一個(gè)國(guó)家的聯(lián)盟行為。對(duì)于這一點(diǎn),我們通過它是否被別國(guó)侵略過或者是否有別國(guó)對(duì)它宣戰(zhàn)來判斷。根據(jù)這一標(biāo)準(zhǔn),二戰(zhàn)中歐洲實(shí)際的聯(lián)盟分布是:一方是英國(guó)、法國(guó)、蘇聯(lián)、捷克斯洛伐克、丹麥、希臘、波蘭和南斯拉夫,而另一方是德國(guó)、意大利、匈牙利、愛沙尼亞、芬蘭、拉脫維亞、立陶宛和羅馬尼亞;葡萄牙與英國(guó)有防衛(wèi)協(xié)議,保持中立。 使用1936年的規(guī)模數(shù)據(jù)得出的地形圖有兩個(gè)局部最低點(diǎn),我們稱之為格局1和格局2,如表4.1所示。它們對(duì)戰(zhàn)爭(zhēng)爆發(fā)后會(huì)有怎樣的聯(lián)盟格局分別給出了具體的預(yù)測(cè)。結(jié)果非常驚人:格局1除了錯(cuò)把波蘭和葡萄牙放在了德國(guó)一邊以外,基本上就和戰(zhàn)爭(zhēng)中實(shí)際的聯(lián)盟格局一致。而格局2則應(yīng)該被稱為支持/反對(duì)蘇聯(lián)聯(lián)盟,其中蘇聯(lián)、希臘和南斯拉夫是一方,其他所有國(guó)家是另一方。 怎么會(huì)這樣呢?首先,這個(gè)結(jié)果在統(tǒng)計(jì)上是顯著的:不管是兩個(gè)格局中的哪一個(gè),它把17個(gè)被預(yù)測(cè)國(guó)家算錯(cuò)2個(gè)以下的概率都小于1/200。其次,格局1的引力盆地比格局2要大2倍多(一個(gè)是47945種可能,一個(gè)是17591種),因此,從一個(gè)隨機(jī)的初始位置出發(fā),落向它的可能性就大得多。所以,只要從二戰(zhàn)期間實(shí)際聯(lián)盟格局中去掉兩個(gè)國(guó)家(波蘭和葡萄牙),就肯定會(huì)是在格局1的引力盆地之內(nèi)。這個(gè)格局同樣也是全局的能量最低點(diǎn),更重要的是,它能夠正確地說明所有的大國(guó)以及絕大部分小國(guó)的聯(lián)盟狀況。總之,若以人口、工業(yè)和軍事力量編制出國(guó)家實(shí)力指數(shù),將其作為指標(biāo),該指標(biāo)對(duì)于這些國(guó)家總規(guī)模的96%的預(yù)測(cè)都是正確的。 如歷史所證明,國(guó)家們并沒有走到小一些的那個(gè)引力盆地中去,如果那樣的話,聯(lián)盟格局將會(huì)是簡(jiǎn)單的支持/反對(duì)蘇聯(lián)的格局。雖然在已經(jīng)知道了謎底的情況下我們會(huì)覺得那種結(jié)局簡(jiǎn)直難以置信,但對(duì)于當(dāng)時(shí)的參與者來說,它卻并不是那么不合情理。而全局最優(yōu)格局把波蘭錯(cuò)放在德國(guó)的一邊,也并非荒謬不堪。因?yàn)椴ㄌm的外交政策是對(duì)強(qiáng)鄰德國(guó)和蘇聯(lián)都采取敵對(duì)的態(tài)度。實(shí)際上,二者的確都對(duì)它虎視眈眈,盡管1939年9月1日是德國(guó)首先侵略了波蘭,但是僅僅16天后,蘇聯(lián)也采取了同樣的舉動(dòng)。這里之所以把波蘭歸到德國(guó)一方(事實(shí)上它是帶著對(duì)英國(guó)一方的同情而保持中立),可能是我們因?yàn)閷?duì)文化和經(jīng)濟(jì)的相似性所采取的指標(biāo)不太恰當(dāng)。 雖然格局1和事實(shí)非常接近,但格局2給出的另一種可能其實(shí)也很有趣。此時(shí),蘇聯(lián)和希臘、南斯拉夫結(jié)成一派,敵方是所有其他國(guó)家(參見表4.1)。在兩種格局中,希臘和南斯拉夫都是加入蘇聯(lián)所在的一方,這主要是因?yàn)槎叨己偷聡?guó)發(fā)生過戰(zhàn)爭(zhēng),從而不愿意與它結(jié)盟。另一方面,這兩種格局里德國(guó)和蘇聯(lián)都是敵對(duì)方。而其他國(guó)家?guī)缀趺總(gè)都有理由不與德國(guó)或者蘇聯(lián)結(jié)盟,它們和這二者的主要差別在于它們是民主政體,只是在第一種格局中聯(lián)合起來反對(duì)德國(guó)這個(gè)大敵人,而第二種格局中它們反對(duì)的是蘇聯(lián)。 即使將1936年的數(shù)據(jù)代入上述的標(biāo)準(zhǔn)的權(quán)力和傾向指標(biāo),用地形理論進(jìn)行預(yù)測(cè),這些戰(zhàn)爭(zhēng)爆發(fā)幾年前的數(shù)據(jù)得出的結(jié)果也和二戰(zhàn)中實(shí)際的聯(lián)盟狀況十分一致。盡管如此,有人會(huì)說,使用簡(jiǎn)單的現(xiàn)實(shí)主義方法來預(yù)測(cè)也可能得到同樣好的效果,F(xiàn)實(shí)主義方法假設(shè)所有的國(guó)家,或者說絕大部分國(guó)家,都彼此害怕。放在地形理論里面,這就意味著其兩兩傾向都是相等且為負(fù)的,可以設(shè)為-1。我們用同樣的數(shù)據(jù)檢驗(yàn)了現(xiàn)實(shí)主義模型,得到的結(jié)果卻很糟糕:17個(gè)國(guó)家,傾向全都是-1,規(guī)模仍然如前所定義,得到的結(jié)果卻是有209個(gè)不同的穩(wěn)定格局,而且這209者中沒有哪一個(gè)像地形模型所預(yù)測(cè)的那樣準(zhǔn)確。而即使只對(duì)5個(gè)傾向?yàn)樨?fù)的大國(guó)進(jìn)行分析,也會(huì)得出4種穩(wěn)定格局,但沒有哪一個(gè)正好是英國(guó)、法國(guó)和蘇聯(lián)對(duì)抗德國(guó)和意大利。從中可見,如果不知道1936年這些國(guó)家之間具體的種族、宗教、領(lǐng)土、意識(shí)形態(tài)和歷史問題狀況,現(xiàn)實(shí)主義模型就沒有足夠的信息可以做出準(zhǔn)確的預(yù)測(cè),F(xiàn)實(shí)主義方法的基本問題在于,它沒有足夠的信息去把各種類型的聯(lián)盟傾向區(qū)分開來,許多不同的聯(lián)盟看上去都是似是而非的。 在對(duì)于二戰(zhàn)聯(lián)盟問題的分析上,傾向矩陣的集群分析也可能得出很好的預(yù)測(cè)結(jié)果。集群分析法通常假設(shè)集群的對(duì)象是等權(quán)重的,那么為了盡可能地接近地形理論,我們就要換用一個(gè)以規(guī)模為權(quán)重的傾向相異度矩陣(dissimilarity matrix of propensities)。然后用不加權(quán)的分對(duì)平均法(UPGMA)計(jì)算出相異度,即采用標(biāo)準(zhǔn)分層凝聚法(standardhierarchicalagglomerativetechnique)對(duì)該矩陣進(jìn)行集群處理,因?yàn)檫@種方法與我們的目標(biāo)最為一致。它得出的兩方集群結(jié)果是希臘和蘇聯(lián)一組,共同反對(duì)其他所有國(guó)家。這就和地形理論的第二種最優(yōu)結(jié)果相似,卻與歷史事實(shí)大相徑庭。如果我們只就大國(guó)進(jìn)行集群,結(jié)果也是把蘇聯(lián)放在反對(duì)英國(guó)、法國(guó)、德國(guó)和意大利的對(duì)立面。 可見,在靜態(tài)分析的方法中,地形理論在估計(jì)聯(lián)盟結(jié)果方面優(yōu)于其他方法。我們可以用事實(shí)進(jìn)一步地檢驗(yàn),隨著二戰(zhàn)一步一步臨近,軍事開支、尤其是德國(guó)的軍事開支迅速膨脹,國(guó)家的相對(duì)規(guī)模(也就是說國(guó)家實(shí)力)發(fā)生了變化。那么把這種變化納入到計(jì)算當(dāng)中來,看看隨著越來越接近戰(zhàn)爭(zhēng)真正爆發(fā)的時(shí)刻,地形及相應(yīng)的預(yù)測(cè)結(jié)果會(huì)有什么變化,這正是我們接下來將要進(jìn)行的一個(gè)有趣的練習(xí)。 1937年,我們得出的兩個(gè)格局與1936年相同,即與二戰(zhàn)實(shí)際情況相同(除了波蘭和葡萄牙)的格局1和支持/反對(duì)蘇聯(lián)型的格局2。到1938年,局部最優(yōu)點(diǎn)只有一個(gè),即格局1。這可能是由于英國(guó)國(guó)內(nèi)輿論越來越傾向于與蘇聯(lián)結(jié)盟,而把對(duì)共產(chǎn)主義的反感暫時(shí)放在一邊。到了1939年,局部最優(yōu)點(diǎn)又只有一個(gè),它和格局1很像,唯一不同的是把波蘭從反蘇聯(lián)的一方搬到了反德國(guó)的一方。這可能要?dú)w因于德國(guó)的實(shí)力越來越強(qiáng),到1939年時(shí)已經(jīng)比蘇聯(lián)強(qiáng)大得多了。 總之,這個(gè)理論用早到1936年的數(shù)據(jù)對(duì)二戰(zhàn)期間的歐洲聯(lián)盟格局進(jìn)行預(yù)測(cè)非常準(zhǔn)確,而且,數(shù)據(jù)年份越靠后,預(yù)測(cè)越完美。到1938年,2個(gè)預(yù)測(cè)縮減成為了1個(gè),1939年的唯一預(yù)測(cè)格局則對(duì)17個(gè)國(guó)家當(dāng)中的16個(gè)都預(yù)測(cè)正確了。這個(gè)結(jié)果出現(xiàn)的概率實(shí)際非常小,少于1/3000。而且,地形理論的預(yù)測(cè)結(jié)果與實(shí)際的歷史現(xiàn)實(shí)逐漸接近的過程也正是20世紀(jì)30年代后期歐洲所實(shí)際發(fā)生的變化的一面鏡子,反映出被動(dòng)員起來投入戰(zhàn)爭(zhēng)的國(guó)家不斷調(diào)整的行動(dòng)。 非常值得注意的是,能得出與歷史現(xiàn)實(shí)如此一致預(yù)測(cè)的,竟是這樣一個(gè)簡(jiǎn)單的理論及其概念的少量應(yīng)用。而且尤其驚人的是,除了與歷史相符的預(yù)測(cè)外,它的另一種結(jié)果對(duì)于歷史的可能性來說也是合情合理的。 我們知道,除地形理論外,只有一個(gè)關(guān)于二戰(zhàn)期間聯(lián)盟格局的預(yù)測(cè)理論,那就是理性選擇理論的阿爾特菲爾德比爾諾·德梅斯奎塔(Altfeld Buenode Mesquita)模型。它預(yù)測(cè)的內(nèi)容是,一旦戰(zhàn)爭(zhēng)爆發(fā)國(guó)家會(huì)怎樣選擇陣營(yíng)。地形理論認(rèn)為聯(lián)盟行為只針對(duì)行動(dòng)的國(guó)家本身,而與此不同的是,阿爾特菲爾德比爾諾·德梅斯奎塔模型中聯(lián)盟行為影響的是國(guó)家的效用,其對(duì)于戰(zhàn)時(shí)聯(lián)盟格局的預(yù)測(cè)以這些聯(lián)盟的狀態(tài)為基礎(chǔ)。在預(yù)測(cè)戰(zhàn)時(shí)聯(lián)盟格局的因果鏈條中,地形理論使用的數(shù)據(jù)(如宗教、意識(shí)形態(tài)差異等)比起聯(lián)盟類型數(shù)據(jù)來,層次要更加深入一些。而且,阿爾特菲爾德比爾諾·德梅斯奎塔模型只能預(yù)測(cè)戰(zhàn)爭(zhēng)爆發(fā)后事件(比如說,這樣就避免了會(huì)把德國(guó)和波蘭判定為對(duì)立方),而地形理論使用的是戰(zhàn)爭(zhēng)爆發(fā)前、甚至是數(shù)年前的數(shù)據(jù)。二者之間的另一個(gè)不同之處在于,阿爾特菲爾德比爾諾·德梅斯奎塔模型僅對(duì)戰(zhàn)爭(zhēng)爆發(fā)后兩個(gè)月內(nèi)參戰(zhàn)的國(guó)家作出預(yù)測(cè),而地形理論會(huì)預(yù)測(cè)所有的民主政體的參與國(guó)的行為。阿爾特菲爾德比爾諾·德梅斯奎塔模型的一個(gè)主要局限性在于,它在做出任何預(yù)測(cè)之前都需要關(guān)于實(shí)際的戰(zhàn)時(shí)聯(lián)盟狀態(tài)的信息,因?yàn)樗眠@些信息來估計(jì)預(yù)期效用方程中各個(gè)要素的相對(duì)影響。但另一方面,該模型容許中立方的存在,而且只要稍加改動(dòng)就可以適用于長(zhǎng)時(shí)段(1816—1965)的戰(zhàn)爭(zhēng)中的相應(yīng)預(yù)測(cè)。從結(jié)果來看,阿爾特菲爾德比爾諾·德梅斯奎塔模型沒有預(yù)測(cè)到英國(guó)和法國(guó)會(huì)參戰(zhàn)反對(duì)德國(guó),而是認(rèn)為二者都會(huì)保持中立。地形理論則準(zhǔn)確地估計(jì)到了英國(guó)和法國(guó)的舉動(dòng),對(duì)那些前面幾年都沒有參戰(zhàn)的國(guó)家的決策也有正確的預(yù)測(cè)。 現(xiàn)在我們已經(jīng)看到,地形理論成功地預(yù)測(cè)了所有大國(guó)和幾乎所有中小國(guó)家的戰(zhàn)時(shí)聯(lián)盟抉擇,接下來要做的,就是把該理論進(jìn)一步應(yīng)用到1990年歐洲變動(dòng)的局勢(shì)中去,預(yù)測(cè)一下當(dāng)蘇聯(lián)終止其強(qiáng)加在東歐國(guó)家身上的控制后,事態(tài)會(huì)有怎么樣的變化。在這項(xiàng)分析里,考察的對(duì)象是1989年身為北約或華約成員的19個(gè)歐洲國(guó)家;該分析已包含了德國(guó)統(tǒng)一的影響,但不考慮接下來的蘇聯(lián)解體事件。這里采用的規(guī)模指標(biāo)和前面的分析一樣,但對(duì)傾向指標(biāo)的運(yùn)用有兩點(diǎn)調(diào)整。第一,因?yàn)閷?shí)質(zhì)上,幾乎所有的歐洲政府都是或希望自己是市場(chǎng)導(dǎo)向的民主政體,這里就不再把意識(shí)形態(tài)算作影響傾向的因素之一。第二,引入經(jīng)濟(jì)關(guān)系作為影響傾向的因素,這可以用在歐洲經(jīng)濟(jì)共同體中的雙邊關(guān)系來衡量。從1989年(并非最優(yōu))的東西聯(lián)盟出發(fā),地形理論給出了一個(gè)唯一的預(yù)測(cè):蘇聯(lián)會(huì)被除保加利亞以外的所有前盟友拋棄。不久之后,蘇聯(lián)解體前的事實(shí)證明這確實(shí)是正確的。1991年,波蘭、捷克斯洛伐克和匈牙利向北約提出希望建立正式關(guān)系,北約則邀請(qǐng)它們加入了新的北大西洋合作理事會(huì)。這里只有對(duì)羅馬尼亞的預(yù)測(cè)失算了。(這么多國(guó)家中只有一個(gè)預(yù)測(cè)錯(cuò)誤的概率已經(jīng)小于1/1000。)從規(guī)模上講,預(yù)測(cè)結(jié)果已經(jīng)把該系統(tǒng)中國(guó)家實(shí)力總和的97%包含進(jìn)去了?偠灾匦卫碚摐(zhǔn)確地預(yù)測(cè)到:華約的解體會(huì)使得絕大部分原蘇聯(lián)盟友轉(zhuǎn)向與西方國(guó)家結(jié)盟,而北約成員沒有哪個(gè)會(huì)改變陣營(yíng)。一個(gè)適用于20世紀(jì)30年代的理論放到90年代竟同樣有效,這真是令人難以置信。 ……
你還可能感興趣
我要評(píng)論
|