早前應邀到一間中學作了關於博弈論(game theory)的個半小時講座,現濃縮為一篇文章與讀者分享:
第一部分:均衡分析
要研究人的行為,我們首先可對人性作一個基本的假設:理性(rationality)。不少人批評理性假設不現實,因為人不總是「自私」的,但這項批評乃狹窄地誤解了「理性」的意思。「理性」不一定指追求個人的物質利益,而是泛指追求自己想達到的目標。例如德蘭修女很想幫助別人,她想辦法幫人就是理性的行為。
在另一極端,其實大部分罪犯也不是瘋子,而是理性的(雖然他們的行為絕不道德)。劫匪往往是衡量其能力、成本、回報和風險後,認為打劫是自己最有效的賺錢方法,否則他便去做其他事情了。經濟學家 Gary Becker 正是研究罪犯的理性行為,並獲得1992年諾貝爾獎。往後的文章也會談到人的一些非理性行為特徵,但理性假設的適用範圍還是比多數人想像中更廣泛的。
當魯濱遜獨自一人在孤島上時,他的決策很簡單,就是做最能達到自己目標的事情。但問題是當有兩個或以上的人同時行動,且會互相影響,而我不知道你會做什麼,你也不知道我會做什麼,我們怎麼知道什麼行動最能達到自己的目標呢?博弈論就是研究理性人的互動決策的學問。
納什均衡無處不在
當約翰 納什(John Nash)尚為博士生時,便提出了後來被稱為「納什均衡」這個博弈論中最重要的概念,以預測及解釋人們在互動決策中的行為:如果有一個行為模式,使得沒有人可在其他人的行為保持不變下,通過單方面改變自己的行為而使自己得益,那麼這個行為模式就是一個納什均衡。
最簡單的例子,為何有些國家的馬路全是靠左駕駛,有些國家全是靠右駕駛?這些習慣在有法律規定之前久已約定俗成。因為如果全社會的人都靠左駕駛,你單方面改為靠右駕駛,你便會撞車,有弊無利,因此所有人靠同一側駕駛是個納什均衡。當然,實際上達致哪個均衡(全靠左抑或全靠右)受許多因素影響,所以世界上兩者皆有。
近年香港立法會經常出現點算法定人數的情況。議員們往往等到15分鐘時限的尾聲才姍姍回到會議廳(以致屢次發生「流會」意外),而不傾向提早歸位。其實這種行為模式也是一個理性的納什均衡,讀者知不知道為什麼呢?
第二部分:機制設計
以上討論的是給定一個博弈,如何預測人們的行為。反過來,我們也可以問:如果要促使人們以某種方式行動,我們應怎樣設計博弈機制?
美國德州警方捉到了一個墨西哥裔銀行劫犯,審訊時找來一個懂西班牙語的居民做翻譯。警察說:「錢藏在哪裡?」翻譯說:「錢藏在哪裡?」劫犯說:「我不告訴你們!」翻譯說:「他不告訴你們。」警察說:「他不說,我們就殺了他!」翻譯說:「你不說,警察就殺了你!」劫犯顫抖著說:「藏……藏在河邊的樹下。」聰明的翻譯眼珠一轉,向警察說:「他說他死也不告訴你們!」
這個故事帶出什麼道理呢?在日常生活中,我們不時需進行機制設計(mechanism design),以達到期望的效果。要一個機制順利運作,必須使各方都有動機遵守遊戲規則,即所謂「激勵相容」(incentive compatible)。
最簡單的例子,生日會上兩人分一個蛋糕,怎樣才能確保公平呢?其中一個方法是讓 A 君把蛋糕切成兩份,然後由 B 君先選。於是A君總會拿到較小的一份,所以他會盡量把兩份切得一樣大。但如果有三人或以上又怎麼辦呢?這是一個殊不簡單的問題。
機制設計應用深廣
機制設計的另一應用是在拍賣活動。拍賣機制一般有四種:
首價拍賣(first-price auction):買家各自秘密出價,價高者得,贏家支付自己的出價。
次價拍賣(second-price auction):買家各自秘密出價,價高者得,但贏家支付的是第二名的出價。
英式拍賣(English auction):拍賣官由極低價開始,慢慢提高價格,各買家可選擇退出,退剩一人即為贏家,並支付他勝出時(即倒數第二人退出時)的價格。
荷蘭拍賣(Dutch auction):拍賣官由極高價開始,慢慢降低價格,第一個舉手的買家即為贏家,並支付他舉手時的價格。
事實上,首價拍賣與荷蘭拍賣的結果是等價(equivalent)的,次價拍賣與英式拍賣也是等價的。更有趣的是,上述各種拍賣機制帶給賣家的平均收入是一樣的!這就是著名的收入等價定理(revenue equivalence theorem)。
然而,買家在不同拍賣機制下的出價則有所不同。每個買家對拍賣的物品有各自的估價。試想想,你在首價拍賣中的出價會等於自己的估價嗎?如果這樣,輸了自是無事發生,即使贏了也只是不賺不賠,有什麼用?所以,首價拍賣中的出價必然低於估價。但在次價拍賣中,每個買家的最佳策略都是以自己的估價為出價,讀者知不知道為什麼呢?
第三部分:行為經濟學
剛才提到有兩種拍賣機制是等價的:第一種是首價拍賣(first-price auction),即買家各自秘密出價,價高者得,贏家支付自己的出價;第二種是荷蘭拍賣(Dutch auction),即拍賣官由極高價開始,慢慢降低價格,第一個舉手的買家即為贏家,並支付他舉手時的價格。
然而,實驗卻顯示這兩種拍賣機制的結果並不等價,買家在荷蘭拍賣下的出價往往較高!雖然我在本系列第一篇中指出「理性人」假設的適用範圍比想像中更廣泛,但人類仍有一些非理性的行為特徵,這就是行為經濟學(behavioral economics)的研究主題,在此略作舉隅。
第一,人們做決定時往往會找一個「參考點」(reference point)。假如你到一個城市旅行,知道全城最好的餐廳是一家壽司店,想去飽餐一頓,去到才發現今天關門。此時,你可能寧願去一家較差的壽司店,也不去全城第二好的(非壽司店)餐廳,因為「今天吃壽司」的計劃已在腦中根深蒂固,使你不願偏離這個參考點。
第二,人們普遍厭惡損失(loss aversion),多於追求得益。有人做過統計,高爾夫球手在避免超標準桿(即避免「損失」)時的擊球,通常比原本已低於標準桿(即在追求「小鳥」等「得益」)時更精準。同樣道理,違例駕駛記分制度採取「扣分制」,而非每次犯規「加分」,也是在運用人們厭惡損失的心理。
人類行為奧妙無窮
第三,人們重視細小概率的可能性。假設一個人被迫玩俄羅斯輪盤(Russian roulette),即一支左輪手槍的六個彈巢中有若干顆子彈,把彈巢隨機旋轉後向自己頭部開槍。當槍內只有一顆子彈,人們願意付很多錢來換取拿掉最後這顆子彈,但如果槍內有四顆子彈,人們卻不願付那麼多錢來換取變成三顆子彈。儘管兩個情況下,拿掉一顆子彈的效果都是把死亡的概率降低六分之一,但人們較緊張只有一顆子彈時那小小的死亡機會。(我不建議大家玩俄羅斯輪盤。)
博弈論、機制設計、行為經濟學都是20世紀才誕生的研究領域,近幾十年佳績紛呈。這三個範疇的奠基人物──數學家納什(John Nash)、經濟學家馬斯金(Eric Maskin)、心理學家卡內曼(Daniel Kahneman)──我在普林斯頓都有幸瞻仰,而三人都先後獲得諾貝爾經濟學獎,反映各種學問千縱萬錯,本是一家,文理交融,乃成大業。
原刊於《大公報》,或作者授權轉載。
(封面圖片:Pixabay)
!doctype>