如何玩弄數據來說故事?

理解任何統計數字時都要了解背後的「前文後理」,否則只會被說故事的「說書人」帶風向。

 大文豪馬克吐溫(Mark Twain)在他的自傳坦言對統計數字沒有好感:「(統計)數字經常欺騙我,特別是我自己整理它們時候。」他更明言「世界上有三種謊言:謊言,該死的謊言,統計數字。」(There are three kinds of lies: lies, damned lies, and statistics.)

對我這種終日「玩弄」數據來餬口的蛋頭學者來說,統計學中不少掩人耳目的小伎倆總要袋住一兩個來傍身。這不是因為我要使詐,而是因為做學問要避免行冤枉路的話防人之心不可無。舉個例子,大約是10年前吧,當年財政司長曾俊華為了證明政府支出增長過快,在預算案中加入了一幅自回歸後(97至98年度)政府收入和支出增長的圖表,顯示從1997至98年度起至2013至14年度,政府收入的累積增幅有59.2%,而政府開支的增幅則高達124.2%,是足足翻了一番後還繼續加碼!

政府收入的累積增幅有59.2%,而政府開支的增幅則高達124.2%,是足足翻了一番後還繼續加碼!(Shutterstock)
政府收入的累積增幅有59.2%,而政府開支的增幅則高達124.2%,是足足翻了一番後還繼續加碼!(Shutterstock)

問題是,當年曾司長為甚麼以97至98年度作起點?從政治正確角度看,這是無可厚非,因為當年是香港回歸祖國懷抱的起點嘛。從「玩弄數據」的角度呢?要知道,回歸當年我們剛好遇上亞洲金融風暴,200億元財赤下政府收入一跌便是23.2%,同期的政府開支就反而上升了23.2%。欄友徐家健當時就直指「要政府開支的累積增幅長期跑贏政府收入可謂易過借火。」欄友更進一步指如果我們由2008至09年度作起點,我們可以達致相反的結論!

再舉另一個例子吧。最近在網上看到另一幅關於內地自十七世紀至1980年人均收入的圖表,顯示其中最低收入的兩年(內戰剛完結的1950年和大饑荒的1961年)都是在共產黨和毛主席治下發生的。對反共產黨或反中國的人來說,這不就是支持「反黨反國」的最佳理由嗎?

然而,如果我們(在同一個網站上)將有關的人均收入圖表「拉長」至2018年,內地的人均收入會暴升至前所未有的高水平。同樣道理,對愛國愛港人士來說,同一張圖表可以顯示無論是改革開放、加入世貿、國退民進甚至是近年的國前民退都是帶領國家向前的好政策,亦印證共產黨治國是最佳選擇。

我不是大文豪,不敢說統計數字是該死的謊言。作為一個終日「玩弄」數據來餬口的蛋頭學者,我只能說理解任何統計數字時都要了解背後的「前文後理」,否則只會被說故事的「說書人」帶風向。

原刊於《am730》,本社獲作者授權轉載。

梁天卓