在AI的時代,大家唯數字馬首是瞻,都說數字最客觀、會說真話,其實數字不一定代表事實,要看這些數字是怎麼來的。
統計數字背後的盲點
例如英國中部地區的嬰兒死亡率比倫敦高很多,這顯然不合理,難道中部的醫生比倫敦的差嗎?原來英國法律,胎兒在12周內死亡算是流產,24周後死亡算是出生後死亡,在12周和24周中間是灰色地帶。中部的醫生慣用死亡,而倫敦的醫生用流產,用詞造成了兩者的差異。所以登錄最重要,開頭錯,後面就不必計算了。
統計是很好的趨勢工具,補償人類這方面的不足。但統計也會放大人類信任數字的盲點,所以在統計之前,先要了解自己在算什麼。經濟學上也有「古德哈特定律」(Goodhart’s law),即當一個措施本身成為目標時,它就不再是一個好的措施。
例如蘇聯曾要求老百姓依人口和牲畜比例,上報他們可以生產的數字,報得愈多愈被表揚。很不幸的是,表揚完了,政府就要他們上繳這些數字的產品,達不到時就要罰。紡織工廠只好縮窄織布機的寬度以達到長度的要求;烏茲別克的農人便把棉花浸水,以達到每天該採的重量。
演算法可能與事實相反
1860年代,美國鋪設跨東西岸的鐵路,這條鐵路修到中西部大草原的歐馬哈(Omaha)後,便轉彎,不走直線,因為它是以鐵軌的哩程計價。
台灣以前山地教師的加給是以山的高度來計算,結果南投縣仁愛鄉的合作國小雖然比都達國小更偏遠,但因學校在半山腰,老師的薪水便比較少。
這個問題在AI用演算法(algorithm)來模擬時更明顯。例如為了要使飛機盡量輕地降落在航空母艦的甲板上,電腦工程師便用演算法來訓練它,沒想到演算法在重複學習時,發現了系統的漏洞。假如它用力把飛機摔在甲板上,強烈的力道會使系統過度負荷,跳出來的數字便是零,表示完美降落,但事實正好相反。
數字有時看起來很公平,但是碰到跟人有關的事情時,一定要考慮數字所代表的意義,因為不管什麼政策,永遠會有對策,有的時候盡信數字不如無數字。
原刊於《天下雜誌》,本社獲作者授權轉載。