什麼是博弈論？

早前應邀到一間中學作了關於博弈論（game theory）的個半小時講座，現濃縮為一篇文章與讀者分享：

第一部分：均衡分析

要研究人的行為，我們首先可對人性作一個基本的假設：理性（rationality）。不少人批評理性假設不現實，因為人不總是「自私」的，但這項批評乃狹窄地誤解了「理性」的意思。「理性」不一定指追求個人的物質利益，而是泛指追求自己想達到的目標。例如德蘭修女很想幫助別人，她想辦法幫人就是理性的行為。

在另一極端，其實大部分罪犯也不是瘋子，而是理性的（雖然他們的行為絕不道德）。劫匪往往是衡量其能力、成本、回報和風險後，認為打劫是自己最有效的賺錢方法，否則他便去做其他事情了。經濟學家 Gary Becker 正是研究罪犯的理性行為，並獲得1992年諾貝爾獎。往後的文章也會談到人的一些非理性行為特徵，但理性假設的適用範圍還是比多數人想像中更廣泛的。

當魯濱遜獨自一人在孤島上時，他的決策很簡單，就是做最能達到自己目標的事情。但問題是當有兩個或以上的人同時行動，且會互相影響，而我不知道你會做什麼，你也不知道我會做什麼，我們怎麼知道什麼行動最能達到自己的目標呢？博弈論就是研究理性人的互動決策的學問。

納什均衡無處不在

當約翰納什（John Nash）尚為博士生時，便提出了後來被稱為「納什均衡」這個博弈論中最重要的概念，以預測及解釋人們在互動決策中的行為：如果有一個行為模式，使得沒有人可在其他人的行為保持不變下，通過單方面改變自己的行為而使自己得益，那麼這個行為模式就是一個納什均衡。

最簡單的例子，為何有些國家的馬路全是靠左駕駛，有些國家全是靠右駕駛？這些習慣在有法律規定之前久已約定俗成。因為如果全社會的人都靠左駕駛，你單方面改為靠右駕駛，你便會撞車，有弊無利，因此所有人靠同一側駕駛是個納什均衡。當然，實際上達致哪個均衡（全靠左抑或全靠右）受許多因素影響，所以世界上兩者皆有。

近年香港立法會經常出現點算法定人數的情況。議員們往往等到15分鐘時限的尾聲才姍姍回到會議廳（以致屢次發生「流會」意外），而不傾向提早歸位。其實這種行為模式也是一個理性的納什均衡，讀者知不知道為什麼呢？

第二部分：機制設計

以上討論的是給定一個博弈，如何預測人們的行為。反過來，我們也可以問：如果要促使人們以某種方式行動，我們應怎樣設計博弈機制？

美國德州警方捉到了一個墨西哥裔銀行劫犯，審訊時找來一個懂西班牙語的居民做翻譯。警察說：「錢藏在哪裡？」翻譯說：「錢藏在哪裡？」劫犯說：「我不告訴你們！」翻譯說：「他不告訴你們。」警察說：「他不說，我們就殺了他！」翻譯說：「你不說，警察就殺了你！」劫犯顫抖著說：「藏……藏在河邊的樹下。」聰明的翻譯眼珠一轉，向警察說：「他說他死也不告訴你們！」

這個故事帶出什麼道理呢？在日常生活中，我們不時需進行機制設計（mechanism design），以達到期望的效果。要一個機制順利運作，必須使各方都有動機遵守遊戲規則，即所謂「激勵相容」（incentive compatible）。

最簡單的例子，生日會上兩人分一個蛋糕，怎樣才能確保公平呢？其中一個方法是讓 A 君把蛋糕切成兩份，然後由 B 君先選。於是A君總會拿到較小的一份，所以他會盡量把兩份切得一樣大。但如果有三人或以上又怎麼辦呢？這是一個殊不簡單的問題。

機制設計應用深廣

機制設計的另一應用是在拍賣活動。拍賣機制一般有四種：

首價拍賣（first-price auction）：買家各自秘密出價，價高者得，贏家支付自己的出價。

次價拍賣（second-price auction）：買家各自秘密出價，價高者得，但贏家支付的是第二名的出價。

英式拍賣（English auction）：拍賣官由極低價開始，慢慢提高價格，各買家可選擇退出，退剩一人即為贏家，並支付他勝出時（即倒數第二人退出時）的價格。

荷蘭拍賣（Dutch auction）：拍賣官由極高價開始，慢慢降低價格，第一個舉手的買家即為贏家，並支付他舉手時的價格。

事實上，首價拍賣與荷蘭拍賣的結果是等價（equivalent）的，次價拍賣與英式拍賣也是等價的。更有趣的是，上述各種拍賣機制帶給賣家的平均收入是一樣的！這就是著名的收入等價定理（revenue equivalence theorem）。

然而，買家在不同拍賣機制下的出價則有所不同。每個買家對拍賣的物品有各自的估價。試想想，你在首價拍賣中的出價會等於自己的估價嗎？如果這樣，輸了自是無事發生，即使贏了也只是不賺不賠，有什麼用？所以，首價拍賣中的出價必然低於估價。但在次價拍賣中，每個買家的最佳策略都是以自己的估價為出價，讀者知不知道為什麼呢？

第三部分：行為經濟學

剛才提到有兩種拍賣機制是等價的：第一種是首價拍賣（first-price auction），即買家各自秘密出價，價高者得，贏家支付自己的出價；第二種是荷蘭拍賣（Dutch auction），即拍賣官由極高價開始，慢慢降低價格，第一個舉手的買家即為贏家，並支付他舉手時的價格。

然而，實驗卻顯示這兩種拍賣機制的結果並不等價，買家在荷蘭拍賣下的出價往往較高！雖然我在本系列第一篇中指出「理性人」假設的適用範圍比想像中更廣泛，但人類仍有一些非理性的行為特徵，這就是行為經濟學（behavioral economics）的研究主題，在此略作舉隅。

第一，人們做決定時往往會找一個「參考點」（reference point）。假如你到一個城市旅行，知道全城最好的餐廳是一家壽司店，想去飽餐一頓，去到才發現今天關門。此時，你可能寧願去一家較差的壽司店，也不去全城第二好的（非壽司店）餐廳，因為「今天吃壽司」的計劃已在腦中根深蒂固，使你不願偏離這個參考點。

第二，人們普遍厭惡損失（loss aversion），多於追求得益。有人做過統計，高爾夫球手在避免超標準桿（即避免「損失」）時的擊球，通常比原本已低於標準桿（即在追求「小鳥」等「得益」）時更精準。同樣道理，違例駕駛記分制度採取「扣分制」，而非每次犯規「加分」，也是在運用人們厭惡損失的心理。

人類行為奧妙無窮

第三，人們重視細小概率的可能性。假設一個人被迫玩俄羅斯輪盤（Russian roulette），即一支左輪手槍的六個彈巢中有若干顆子彈，把彈巢隨機旋轉後向自己頭部開槍。當槍內只有一顆子彈，人們願意付很多錢來換取拿掉最後這顆子彈，但如果槍內有四顆子彈，人們卻不願付那麼多錢來換取變成三顆子彈。儘管兩個情況下，拿掉一顆子彈的效果都是把死亡的概率降低六分之一，但人們較緊張只有一顆子彈時那小小的死亡機會。（我不建議大家玩俄羅斯輪盤。）

博弈論、機制設計、行為經濟學都是20世紀才誕生的研究領域，近幾十年佳績紛呈。這三個範疇的奠基人物──數學家納什（John Nash）、經濟學家馬斯金（Eric Maskin）、心理學家卡內曼（Daniel Kahneman）──我在普林斯頓都有幸瞻仰，而三人都先後獲得諾貝爾經濟學獎，反映各種學問千縱萬錯，本是一家，文理交融，乃成大業。

原刊於《大公報》，或作者授權轉載。

（封面圖片：Pixabay）