這個題目聽起來夠厲害吧?是的,就如「元宇宙」忽然無處不在,對科技一竅不通的人都莫名其妙地成了專家,另一類廣泛被濫用的術語,就是機器學習、深度學習等的數據分析方法,老是常出現,雖然講者未必知道自己在講什麼,聽者也未必知道自己在聽什麼。
何謂專家的權威?
在人人都是專家、KOL無所不懂的年代,將事情說得高深莫測、拋出大量術語才是生存之道。說得太簡單太清楚,反而會失去專家的權威。
沒興趣做專家,也就不怕給大家一個簡單形容:你想「教」電腦程式做一件工作,可以是捉棋,可以是預測經濟走勢,可以是推斷消費者行為,可以是看圖辨認事物,關鍵是你手頭上有足夠的數據,以及為表現訂立一個清楚準則(如捉棋是為了贏、預測為了準確),那你就可讓電腦程式自動去「學習」,在數據中找尋提升表現方法,探索出肉眼看不到的蛛絲馬跡,就此而已。
那堆霸氣十足的字眼,反映的主要是電腦程式「學習」方式的差異(例如模仿人腦運作的人工神經網絡),以及使用者參與程度的高低(由步步指導電腦程式,到完全自由放任)。
這類數據分析方法的長處,是利用愈來愈強大的電腦運算能力,可將數據中有用的資訊榨乾榨盡,在不少情況下表現勝過一般統計模型。
數據分析是技術還是魔術?
只是當方法威力愈大,行外固然亂吹得不亦樂乎,行內濫用、誤用亦愈見普遍。且分享最近兩次親身經歷。話說有項研究,目標是預測匯率每日走勢,結果就將匯率連同其他數十個經濟金融指標,一併交給幾個機器學習的最新方法處理。研究中的圖表數字洋洋幾十頁,結論是要預測今日匯率,關鍵在於昨日匯率,其他指標相比下並不重要。
其實,行內過去幾十年已有共識,匯率表現跟隨機行走(random walk)不容易分得開,昨天匯率往往是今天匯率的最佳指標。這樣勞師動眾地小題大做舊事重提,除了告知世人自己懂得使用機器學習的程式,根本沒有其他意義。
另一項研究更誇張。同樣是動用一堆複雜機器學習方法,將所有術語都搬了出來,連用一堆估算加上五顏六色圖表,乍看之下相當專業,只是細心一看,原來一輪花式表演背後,數據其實只有20個數字。
用如此有限材料,可以作出這樣精彩分析,那就不是技術而是魔術了。與其亂來,何不去得更盡?我提議利用人工智能機器學習睇相睇風水,如Machine-Learning Feng Shui(簡稱MLFS)又或I Ching with Artificial Intelligence(簡稱ICAI),結合東西方智慧,極有震懾效果,絕對有得諗。
原刊於《am730》,本社獲作者授權轉載。