塑造美好的世界──向沙普利教授致敬

一間中學請我作1.5小時的長篇講座，我選了 Shaping a Better World: In Memory of Lloyd S. Shapley （1923-2016）為題，以紀念沙普利教授這位幾個月前逝世的博弈論大師。以下是演辭節錄的譯文：

聽到「博弈論」（game theory），大家首先想到的名字一定是約翰．納什（John Nash）。的確，納什發明的「納什均衡」（Nash equilibrium）猶如盤古開天。給定一個博弈，要預測人們會如何行動，便要用到納什均衡。

但我們可以反過來問：如果我們是博弈的設計者，要促使人們作出某種行動，我們應怎樣設計那場博弈呢？這就是機制設計（mechanism design）的領域。而萊特．沙普利（Lloyd Shapley）就是機制設計的先驅。他在2012年獲得諾貝爾經濟學獎，跟1994年獲獎的納什教授互相輝映。

雖然在經濟學界登上最高殿堂，但納什和沙普利教授終其一生都堅持自己是數學家。事實上，博弈論主要是由普林斯頓大學幾位數學家在上世紀四、五十年代開創出來的，後來這門學問才被歸入經濟學中繼續發展。

普林斯頓──博弈論的搖籃

下圖是在博弈論奠基時期，普林斯頓的六個關鍵人物。數學家馮諾伊曼和經濟學家 Oskar Morgenstern 合著了博弈論的開山之作 Theory of Games and Economic Behavior，而數學系的 Albert W. Tucker 則發明了著名的「囚徒困境」博弈（prisoner’s dilemma，詳見拙作《囚徒困境的啟示》）。納什、Harold W. Kuhn、沙普利是普林斯頓數學系研究院的同學，三人均是Tucker的得意門生（雖然 Kuhn 官方登記的博士導師是另一人）。此外，沙普利也有跟另一位大師學習：他的履歷上的第一行是“Research Assistant, Princeton University, A. Einstein”。

雖然 Harold Kuhn 沒有拿諾貝爾獎，但他是擴展形式博弈（extensive-form games）的巨匠，也是個有情有義的朋友。在納什患上精神分裂症的幾十年間，Kuhn 一直不離不棄地照顧納什和關心其妻子，更年復一年地推薦納什拿諾貝爾獎。1994年，當諾貝爾獎委員會終於決定頒獎給納什時，年近九旬的 Tucker 已在病榻上奄奄一息。當時只有提名人 Kuhn 知道這個保密消息，連納什本人都不可以告知。他們兩人一起去探望 Tucker，回去的路上，Kuhn 突然跟納什說：「噢，我漏了一些東西」，獨自折返醫院，偷偷告訴 Tucker 納什獲獎了。Tucker 十分感動，然後便安心上路。至於 Kuhn、納什和沙普利教授這「黃金一代」，則在2014、2015、2016年先後離世，彷如一個時代的落幕。

另一位憑博弈論獲諾貝爾獎的學者 Robert Aumann 把沙普利教授稱為「有史以來最好的博弈論家」，究竟沙普利做了什麼工作呢？在機制設計方面，他對單向配對（one-sided matching）和雙向配對（two-sided matching）都有拓荒之功。此外，他在合作博弈（cooperative games）的領域創立了 Shapley value 的概念，並類似地定義了 Shapley-Shubik power index，可用來計算國會內各黨派的勢力分佈。最後，沙普利跟納什等人合作，發明了一個叫So Long Sucker的棋盤遊戲，但這不屬於今天講座的範圍。

1974年，沙普利和 Herbert Scarf 在發表了一篇關於單向配對的經典論文。假設有n個人、n間屋，每個人擁有一間屋。我們想開設一間「房屋交易所」（clearing house），如果這n個人參加我們這個交易所的機制，我們便會把這n間屋重新分配給這n個人（仍是每人一間）。

單向配對──人人滿意的交換

但怎樣才能確保這n個人都願意參加我們的機制呢？每個人對那n間屋都有一個偏好次序（不同人可以有不同喜好）。顯然，不能有任何人得到的屋子比他原來的更「差」（即他更不喜歡），否則他便會寧願不玩。但單是這樣還不夠，還有一個更強的要求，就是不能存在k個人，他們可退出這個機制，並以某種方式重新分配他們原來的屋子，使得每個人都不比在我們的機制下更差，並有至少一個人比在我們的機制下更好。否則，這k個人便會集體杯葛我們機制，另起爐灶了。

舉個例子，便容易明白這是什麼意思了。假設有三個人 A、B、C 、三間屋 a、b、c 。開始時，A 擁有 a，B 擁有 b，C 擁有 c。他們的偏好如下（第一行為最喜歡，第三行為最不喜歡）：

假設我們的交易所採用的是「依次獨裁」機制（serial dictatorship），即先讓A得到他最喜歡的房子，然後讓 B 在剩下的房子中選擇最喜歡的，C 則得到最後剩下的房子。易知，這個機制會導致 A 得到 c，B 得到 b，C 得到 a。然而，如果 B 和 C 合謀推出這個機制，並在他們之間交換屋子，即 B 得到 c，C 得到 b，兩人都比在我們的機制下更滿意。因此，「依次獨裁」並不總能吸引所有人參加。

另一方面，沙普利和 Scarf 的論文提出了一個巧妙的機制，叫作 top trading cycle。簡單來說，就是先任意選出第一個人，把第1個人最喜歡的屋子的業主稱為第二個人，把第二個人最喜歡的屋子的業主稱為第三個人，如此類推，遲早會出現循環（讀者可想想為什麼！）。此時，讓這個循環裏的每個人都取得自己最喜歡的屋子（即該循環裏的所有屋子「移一格」）。然後，當這個處理完的循環裏的所有人和屋子都不存在，只着眼於剩下的人和屋子，不斷重複以上步驟，直到不再有循環（即每個循環的長度都是1）為止。論文證明了，top trading cycle 機制產生的分配，必定不會讓任何一組人有動機另起爐灶！

市場設計──造福人類的思想

現實中的不少房產交換市場，都用到了沙普利和 Scarf 發明的這個機制，其他應用還包括重新分配學生宿舍、交換聖誕禮物、編排時間表等等。至於沙普利和 David Gale 在雙向配對方面的工作，講座的這部分跟我早前發表的《為什麼要「男追女」成家立室？》一文大同小異，在此就不重複了。我只想說，雙向配對的機制的應用同樣廣泛，例如實習醫生、學校收生、器官捐贈、舞會伴侶等等。

誠然，世界上大部分市場都是海耶克所說的「自然秩序」（spontaneous order），是由人們慢慢協調發展出來的。但一些較為複雜的市場，尤其是要求交易雙方高度匹配的市場（例如器官捐贈需要血型合適），便往往有不同人設計不同機制，然後根據參加人數的多寡而汰劣留優，而不同機制之間的競爭，本身也是一個自發演化的過程。沙普利教授正是通過發明各種有效而穩定的機制，塑造了世界上不少市場的新面貌，為人類社會解決難題。

最後，引用2012年跟沙普利同獲諾貝爾獎的 Alvin Roth 教授，為沙普利寫的悼文的一段話：「月球上有一個名為沙普利的隕石坑，紀念沙普利教授的天文學家父親。在博弈論中，沙普利教授像隕石般驚天動地的貢獻，也將使我們永遠懷念。」

相關文章：

（圖片：nobelprize.org）