塑造美好的世界──向沙普利教授致敬

萊特.沙普利(Lloyd Shapley)就是機制設計的先驅。他在2012年獲得諾貝爾經濟學獎,跟1994年獲獎的納什教授互相輝映。
一間中學請我作1.5小時的長篇講座,我選了 Shaping a Better World: In Memory of Lloyd S. Shapley (1923-2016)為題,以紀念沙普利教授這位幾個月前逝世的博弈論大師。以下是演辭節錄的譯文:
 
聽到「博弈論」(game theory),大家首先想到的名字一定是約翰.納什(John Nash)。的確,納什發明的「納什均衡」(Nash equilibrium)猶如盤古開天。給定一個博弈,要預測人們會如何行動,便要用到納什均衡。
 
但我們可以反過來問:如果我們是博弈的設計者,要促使人們作出某種行動,我們應怎樣設計那場博弈呢?這就是機制設計(mechanism design)的領域。而萊特.沙普利(Lloyd Shapley)就是機制設計的先驅。他在2012年獲得諾貝爾經濟學獎,跟1994年獲獎的納什教授互相輝映。
 
雖然在經濟學界登上最高殿堂,但納什和沙普利教授終其一生都堅持自己是數學家。事實上,博弈論主要是由普林斯頓大學幾位數學家在上世紀四、五十年代開創出來的,後來這門學問才被歸入經濟學中繼續發展。
 

普林斯頓──博弈論的搖籃

 
下圖是在博弈論奠基時期,普林斯頓的六個關鍵人物。數學家馮諾伊曼和經濟學家 Oskar Morgenstern  合著了博弈論的開山之作 Theory of Games and Economic Behavior,而數學系的 Albert W. Tucker  則發明了著名的「囚徒困境」博弈(prisoner’s dilemma,詳見拙作《囚徒困境的啟示》)。納什、Harold W. Kuhn、沙普利是普林斯頓數學系研究院的同學,三人均是Tucker的得意門生(雖然 Kuhn 官方登記的博士導師是另一人)。此外,沙普利也有跟另一位大師學習:他的履歷上的第一行是“Research Assistant, Princeton University, A. Einstein”。
 
 
雖然 Harold Kuhn  沒有拿諾貝爾獎,但他是擴展形式博弈(extensive-form games)的巨匠,也是個有情有義的朋友。在納什患上精神分裂症的幾十年間,Kuhn 一直不離不棄地照顧納什和關心其妻子,更年復一年地推薦納什拿諾貝爾獎。1994年,當諾貝爾獎委員會終於決定頒獎給納什時,年近九旬的 Tucker 已在病榻上奄奄一息。當時只有提名人 Kuhn 知道這個保密消息,連納什本人都不可以告知。他們兩人一起去探望 Tucker,回去的路上,Kuhn 突然跟納什說:「噢,我漏了一些東西」,獨自折返醫院,偷偷告訴 Tucker 納什獲獎了。Tucker 十分感動,然後便安心上路。至於 Kuhn、納什和沙普利教授這「黃金一代」,則在2014、2015、2016年先後離世,彷如一個時代的落幕。
 
另一位憑博弈論獲諾貝爾獎的學者 Robert Aumann 把沙普利教授稱為「有史以來最好的博弈論家」,究竟沙普利做了什麼工作呢?在機制設計方面,他對單向配對(one-sided matching)和雙向配對(two-sided matching)都有拓荒之功。此外,他在合作博弈(cooperative games)的領域創立了 Shapley value  的概念,並類似地定義了 Shapley-Shubik power index,可用來計算國會內各黨派的勢力分佈。最後,沙普利跟納什等人合作,發明了一個叫So Long Sucker的棋盤遊戲,但這不屬於今天講座的範圍。
 
1974年,沙普利和 Herbert Scarf 在發表了一篇關於單向配對的經典論文。假設有n個人、n間屋,每個人擁有一間屋。我們想開設一間「房屋交易所」(clearing house),如果這n個人參加我們這個交易所的機制,我們便會把這n間屋重新分配給這n個人(仍是每人一間)。
 

單向配對──人人滿意的交換

 
但怎樣才能確保這n個人都願意參加我們的機制呢?每個人對那n間屋都有一個偏好次序(不同人可以有不同喜好)。顯然,不能有任何人得到的屋子比他原來的更「差」(即他更不喜歡),否則他便會寧願不玩。但單是這樣還不夠,還有一個更強的要求,就是不能存在k個人,他們可退出這個機制,並以某種方式重新分配他們原來的屋子,使得每個人都不比在我們的機制下更差,並有至少一個人比在我們的機制下更好。否則,這k個人便會集體杯葛我們機制,另起爐灶了。
 
舉個例子,便容易明白這是什麼意思了。假設有三個人 A、B、C 、三間屋 a、b、c 。開始時,A 擁有 a,B  擁有 b,C 擁有 c。他們的偏好如下(第一行為最喜歡,第三行為最不喜歡):
 
 
假設我們的交易所採用的是「依次獨裁」機制(serial dictatorship),即先讓A得到他最喜歡的房子,然後讓 B 在剩下的房子中選擇最喜歡的,C 則得到最後剩下的房子。易知,這個機制會導致 A 得到 c,B 得到 b,C 得到 a。然而,如果 B 和 C 合謀推出這個機制,並在他們之間交換屋子,即 B 得到 c,C 得到 b,兩人都比在我們的機制下更滿意。因此,「依次獨裁」並不總能吸引所有人參加。
 
另一方面,沙普利和 Scarf 的論文提出了一個巧妙的機制,叫作 top trading cycle。簡單來說,就是先任意選出第一個人,把第1個人最喜歡的屋子的業主稱為第二個人,把第二個人最喜歡的屋子的業主稱為第三個人,如此類推,遲早會出現循環(讀者可想想為什麼!)。此時,讓這個循環裏的每個人都取得自己最喜歡的屋子(即該循環裏的所有屋子「移一格」)。然後,當這個處理完的循環裏的所有人和屋子都不存在,只着眼於剩下的人和屋子,不斷重複以上步驟,直到不再有循環(即每個循環的長度都是1)為止。論文證明了,top trading cycle 機制產生的分配,必定不會讓任何一組人有動機另起爐灶!

 

市場設計──造福人類的思想

 
現實中的不少房產交換市場,都用到了沙普利和 Scarf 發明的這個機制,其他應用還包括重新分配學生宿舍、交換聖誕禮物、編排時間表等等。至於沙普利和 David Gale 在雙向配對方面的工作,講座的這部分跟我早前發表的《為什麼要「男追女」成家立室?》一文大同小異,在此就不重複了。我只想說,雙向配對的機制的應用同樣廣泛,例如實習醫生、學校收生、器官捐贈、舞會伴侶等等。
 
誠然,世界上大部分市場都是海耶克所說的「自然秩序」(spontaneous order),是由人們慢慢協調發展出來的。但一些較為複雜的市場,尤其是要求交易雙方高度匹配的市場(例如器官捐贈需要血型合適),便往往有不同人設計不同機制,然後根據參加人數的多寡而汰劣留優,而不同機制之間的競爭,本身也是一個自發演化的過程。沙普利教授正是通過發明各種有效而穩定的機制,塑造了世界上不少市場的新面貌,為人類社會解決難題。
 
最後,引用2012年跟沙普利同獲諾貝爾獎的 Alvin Roth 教授,為沙普利寫的悼文的一段話:「月球上有一個名為沙普利的隕石坑,紀念沙普利教授的天文學家父親。在博弈論中,沙普利教授像隕石般驚天動地的貢獻,也將使我們永遠懷念。」
 
相關文章
 
(圖片:nobelprize.org)

盧安迪