向納殊致敬——《納甚博弈論論文集》

推薦這本老書的原因自然是向納殊致敬,他最近去世了。很久以前買的這本書,看過兩遍,但沒有看懂數學部分,可是數學部分就是書的主體,因此等於幾乎沒有看懂,所以於我仍然是新書。這本書裏的幾篇論文使納殊獲得諾貝爾獎,但推薦這本書似乎是個悖論:專業人士必定看過如此重要的名著,因此無需推薦;非專業人士可能看不懂,因此也無需推薦。
撰文:趙汀陽(中國社會科學院哲學研究所研究員)
 
推薦這本老書的原因自然是向納殊致敬,他最近去世了。很久以前買的這本書,看過兩遍,但沒有看懂數學部分,可是數學部分就是書的主體,因此等於幾乎沒有看懂,所以於我仍然是新書。這本書裏的幾篇論文使納殊獲得諾貝爾獎,但推薦這本書似乎是個悖論:專業人士必定看過如此重要的名著,因此無需推薦;非專業人士可能看不懂,因此也無需推薦。
 
電影《有你終身美麗》沒有引起我的興趣。人們往往想像偉人應該是怪異的,其實不怪異的偉人更多,而且,偉人也往往是被故事化而敘述成怪異的(當然,納殊有過精神分裂是真的)。我寧願相信偉人們只是眼睛更為乾淨,或者眼界更為遼遠。十多年前,我聽過納殊在數學會議上的一個講座,也基本沒有聽懂,但我喜歡他的講演。納殊高瘦,不知是有些靦腆還是只想着問題沒看人,感覺他看着漂浮在他眼前空氣中的「問題」說啊說,仔細討論了幾個難點之後,他說很抱歉,他尚未能夠解決這個問題,而且好像也沒什麼希望解決這個問題。
 

博弈論影響力巨大

 
博弈論可能是數十年來最有影響的思維方法論,已經得過四次諾貝爾獎。博弈論本來是一種應用數學,通常,數學的思想性來自理論數學,應用數學只具有應用性,而博弈論的奇妙之處在於它不僅具有廣譜的應用性,同時還具有思想性,只是它的思想性並非來自數學,而是來自生活問題,數學的應用性和生活的思想性的結合使博弈論成為一種獨特的思想,廣泛用於許多領域,特別是經濟學和政治學。哲學也是較早引進博弈論的領域,略晚於經濟學和政治學,大概是上世紀60年代末70年代初,羅爾斯把博弈論原理用於分析社會的初始狀態。博弈論與經濟學的關係最為密切,可能是因為博弈論採用了經濟學的基本假定,只考慮利益競爭和個人理性。
 
不過,生活事實通常都不是單面的,而是複雜事實。即使僅僅算計利益,也有着難以算清的複雜因素,甚至「利益」就是個尚未良好定義的概念,有許多利益並不能量化計算,而且,即使是可以量化的利益,它的實際所值也受到許多因素的波動影響,因此,生活問題並不能完全還原為博弈。真實的生活問題缺乏足夠的明確性和穩定性,因此,生活博弈的真實解決未必都是納殊均衡解。但納殊均衡是個標杆,或者說是個「標準答案」,就是說,假定不存在強制性,博弈雙方都一心一意地唯利是圖,並且思維正確(思維具有自身協調性consistency),那麼,納殊均衡應該是唯一解,其它「糊塗」選擇不算是解而算「錯誤」。顯然,不求回報的行為都會被歸入糊塗選擇,可是,不求回報的行為真的是糊塗嗎?或者說,理性真的僅僅只是用來算計利益嗎?追求精神目標是非理性嗎?
 

有關納殊均衡的數個思考

 
納殊均衡是互相呼應的成對策略,其中每個人所選中的策略正好是另一個人所選中的策略的最優對策,就是說,博弈雙方選中的策略對自己而言都是最優的,因此,誰都不想修改策略。如果中立而不是貶義地使用「僵局」這個概念的話,那麼,納殊均衡在效果上類似於僵局。納殊均衡精確地解釋了各種壞的僵局,比如眾所周知的囚徒困境;納殊均衡也能夠解釋某些好的僵局,據說各種遊戲規則,包括制度、法律、社會規則、倫理規範等等都是基於長期穩定的納殊均衡而被確認的。我想,納殊喜歡的恐怕不是已經太多的掌聲,而是疑問和討論,因此我想說說幾個疑問來向納殊致敬。當然,我只能哲學化的討論,不能滿足量化標準,還請專業人士不要苛求。
 
根據孔子的仁理論,兩人互動模式最有可能產生正面合作均衡,因為兩人形成互利均衡的可達性(accessibility)比起其他可能性更為明顯,而且風險最小,以親親為典型,乃至朋友。儘管不排除出現囚徒困境的可能性,但囚徒困境的產生似乎是因為存在“場外第三者”:警察。因此我疑心囚徒困境到底應該算是雙人博弈,還是應該算是包括隱身第三者的三方博弈?當然,如果不把警察算作是博弈方,而把警察定義為博弈客觀環境,就順理成章沒有問題了。但我仍然覺得警察的存在就是個強制性條件,正是警察的存在把兩人關係強迫變成非合作博弈,並且把囚徒活活逼得別無選擇。我的意思是,如果真的沒有強制性條件,兩人互動行為形成合作均衡的可能性大於非合作均衡,真正容易出現非合作博弈的情況應該是三人以上的互動行為。正如孔子理論暗示的,二人關係是倫理的,而三人以上關係才是政治的。
 
《納甚博弈論論文集》封面。(高和分享圖片)
《納甚博弈論論文集》封面。(高和分享圖片)
 
還有一個理解,也不知道對不對。如果雙人非合作博弈所形成的納殊均衡不會太好,就像囚徒困境那樣錯過雙方本來可能得到的帕累托改進,那麼,人數巨大的眾人非合作博弈所形成的納殊均衡恐怕只能更差,理由是,在非強制條件下,不存在硬性秩序,那麼,眾人博弈的最優策略很可能就是「搭便車」;或者與大眾的盲目選擇保持盲目的一致,可以稱為「趕主流」;或者人人互相欺騙互相背叛;或者分裂為多個較小群體然後發生衝突和戰爭;如此等等的最優策略,其實都是很差的策略。總之,在缺乏強制秩序的條件下,眾人博弈能夠自然形成的納殊均衡恐怕沒有一個好過囚徒困境,至多等價於囚徒困境。這其實是個古老的猜想,荀子、墨子、韓非和霍布斯等等政治哲學家都有類似的猜想,大概意思是,假如不是求助於強制力量所提供的公共秩序和可信的懲罰與報償制度,或者說,假如不是神或聖王來與眾人立約,眾人恐怕沒有希望自動形成一種好過囚徒困境的契約,甚至無法形成契約——任何契約都是以武力作保的。
 

什麼是公正?

 
還有一個疑問。如果博弈論只接受經濟學的基本假設,那麼它足以解釋一切壞事,但似乎解釋不了任何好事,準確地說,它的解釋範圍至多達到不好不壞的價值分界線。假定價值以0為分界,把壞事理解為負數,把好事理解為正數,那麼,博弈論能夠解釋所有負數現象,最大解釋值為0。這個0意味着公正概念,也就是成本與回報的對等性。於是,博弈論能夠解釋的最好均衡是公正,而不可能解釋任何超出公正的更好均衡。公正並沒有倫理學所想像的道德光輝,只不過是道德與不道德的中性分界線。在非強制條件下,社會博弈能夠自然形成的倫理規範不可能超出公正概念,事實上幾乎沒有希望達到公正。公正是倫理的極值,至於其它倫理概念,比如平等和公平,都還沒有達到公正,只是接近公正而已。凡是超過公正的行為都有不同程度的自我犧牲,一般是犧牲利益,極致是犧牲生命,只有犧牲才意味着真正的道德。
 
公正只是保證人人不吃虧的正當算計,而弱於公正的其它倫理都是斤斤計較的算計,在這個意義上,倫理與道德完全不是同類項。我的疑問是,假如博弈論僅僅接受經濟學的假設,它就無法解釋人類生活中所有高於公正的道德行為,也無法解釋一切精神追求,那麼,人類生活中超過公正而互相不算計的高尚均衡又是如何可能的?我不敢肯定博弈論家對此類問題是否感興趣,但人之間確實存在着一些高尚均衡,既沒有強制條件,而又不需要共同知識,這種高尚均衡才真正與美麗心靈有關。將來的博弈論能夠解釋與利益算計無關的高尚均衡嗎?
 
內容簡介
 
《納甚博弈論論文集》是納殊對討價問題的濺察力的明證:當兩個參與人對時間的貼現率相同,並且連續出價區間可以任意小時,魯賓斯坦的風洞模型的惟一子博弈完美均衡十分接近納殊討價還價解。簡言之,雖然現代的博弈論理論家已經用魯賓斯坦的討價還價模型代替了納殊本人的非合作討價還價模型,但是他們仍然應用納殊的整套方法,並且仍然應用這套方法來支持由納殊公理得出的討價還價解。
 
 
 

專家閱讀平台