楊強:AI可稱霸棋局 金融科技應用另有挑戰

科大BDI主任楊強教授指,如何採集並準確分析與商業場景相關的資訊是金融科技和人工智能的大課題。

編按:「相約科大,遇見未來」大學金融科技教育論壇由香港科技大學、FDT金融創新工場和微軟亞洲研究院聯合主辦,由蜂投證券、香港科技園公司、香港應科院合辦,於2017年11月24日假香港科技大學賽馬會高等研究院舉行。

當日,論壇嘉賓香港科技大學BDI大數據研究所主任楊強教授發表題為「由AI推動的金融科技發展」的主題演講,內容摘錄如下:

AlphaGo可說是近來大眾興起AI熱的唯一一個原因。從2016年3月起,這項科技就引起社會對人工智能的關注,發展到2017年更強大的AlphaGo Zero版本(新版本具備自我學習能力,不需要人類提供任何先備知識);不過,這個項目在人工智能和演算法所取得的成功,是否能複製至商業場景、幫助金融科技發展呢?

楊強教授指,圍棋的規則複雜,本來是電腦極難學習的,但相對也較商業應用場景簡單。(灼見名家傳媒)
楊強教授指,圍棋的規則複雜,本來是電腦極難學習的,但相對也較商業應用場景簡單。(灼見名家傳媒)

棋盤可任AI縱橫 但商業場景更複雜

AlphaGo 的發展揭示了兩方面值得留意的事情。第一是演算法。它用上了強化學習(reinforcement learning)和深度學習(deep learning),反映了這方面技術愈漸臻善。

第二個問題關乎清晰的規則。圍棋的規則複雜,本來是電腦極難學習的,有人推算所有可能出現的棋局加起來有10的170次方那麼多,比整個宇宙的原子數目加起來還要多。不過,棋類遊戲的規則通常還算清晰,電腦很好理解,但是來到商業場景,比如說金融科技,界線通常都是模糊的,沒有明確的遊戲規則,也經常有灰色地帶要留意,所以我們要設法讓人工智能系統明白這些複雜的情況。

金融科技應用要跟時間競賽

圍棋是個很適合使用人工智能的應用場景,因為迴路(loop)夠短,棋局中所下的每一子很容易就可以為系統提供新資料,傳送到系統模型分析。人工智能科技靠大數據分析來運作,不可以過於依賴人工提供的訓練資料。一個相反的例子是教學。教學過程的信息鏈迴路比較長。如果你想知道課程的質量,通常要等一個學期結束,學生方能提供有效的資訊和評價。

但在金融科技,迴路(loop)夠短很重要,索取回饋資訊(feedback)的頻率也要高,因為如果頻率不高,就要等待較長時間才能累積足夠的資料。另外,我們採用人工智能系統的建議後,要等多久才能發揮效用呢?在金融科技的領域,這要很快才行,因為一牽涉到複合利息和投資,就要跟時間競賽,每天也要爭分奪秒,沒有多餘時間可以等。

楊強教授指,在金融應用場景中,用戶、人工智能系統、應用程式之間的信息迴路要短,向系統反映回饋要及時完成。(香港科技大學)
楊強教授指,在金融應用場景中,用戶、人工智能系統、應用程式之間的信息迴路要短,向系統反映回饋要及時完成。(香港科技大學)

總結近來兩三個人工智能發展上的突破而言,由於遊戲擁有「規則明晰、迴路短、回饋產生的頻率高」等特點,用人工智能模型來應戰的話,易收佳效。

AI閱讀、機器視覺科技愈見成熟

近年AI科技發展愈趨成熟,相關應用的成本下降,AI的未來會朝向哪裏發展?

機器視覺的發展進展不錯,從手機、谷歌、雲端等途徑收集得大量數據,有助完善技術,也有不少行內專家例如史丹福大學教授找到方法標註這些資料,令一些研究的測試有辦法進行。物件分類、物件關係辨測(object relationship)、視頻追蹤、目標檢測和前背景分離等等的發展也取得不少進展。至於與自然語言相關的技術,雖然發展情況雖然及不上機器視覺,也發展得挺快。

相比之下,自然語言的字詞在不同句子裏的意思更加欠缺清晰定義。研發人員總是希望機器可以閱讀大量文件而且懂得跟人類有效溝通互動,希望機器除了能掌握一份文件的意思,還能理解一大堆文件。這要靠不同的人按各自的個人理解和關注點來分析同一份文件,機器採集了這些數據後繼而學習這些閱讀和分析模式。要做到上述的,就要靠knowledge extraction(一譯「知識擷取」)等技術,訓練機器精準理解字裏行間的意思。

相親網的大數據要快、齊、準

另外,還有一個老問題:如何讓機器產出合適的建議。

中國的相親網也開始應用人工智能和數據分析,為用戶提供個人化服務。(楊強教授簡報)
中國的相親網也開始應用人工智能和數據分析,為用戶提供個人化服務。(楊強教授簡報)

中國有很多約會網站,右邊的圖中那些錯綜複雜的紅線代表不同地方的用戶之間跨省跨城市的互動。產生匹配用戶建議的機器除了要準確理解每個用戶的資料(例如職業)、掌握他們對約會對象的要求和期望,還要考慮他們在時間和空間方面的限制,整個系統非常複雜,而更棘手的是如何更新這個模型,因為系統更新速度若不夠快就會很容易用了過時的錯誤資料。

這些服務和建議都要靠分析大數據而得,但如果數據不足,要怎麼辦呢?遷移學習(transfer learning)可以派上用場。人類可以把學習某一件事(比如說騎自行車)的知識應用到學習性質相近的另一件事上(比如說騎摩托車),機器也可以嘗試這樣做。就算欠缺某個範疇的資料,我們可以建立模型,向機器提供相類範疇的資料,打破資訊量低的限制,產出高度準確且可靠的結果,也便利終端應用層面的個人化操作。這是現今機器學習發展的一個大方向,研究遷移學習的專家尚有漫漫長路。

遷移學習有助保私隱 新思路帶來突破

提到了個人化的發展方向,就不得不提另一個關鍵詞:私隱。以往,要令模型準確地了解每個用戶的情況並按此提供服務,就要先把他們的個人資料傳送到雲端和處理器。不過,若使用遷移學習的方法來支援人工智能服務,就可以繞過這一點,用戶不用提供額外資料也能享有個人化服務。

我一些剛畢業的學生的研究題目是傳遞式的遷移學習(transitive transfer learning),這個概念談的不再是將兩個範疇相近的資料集拉到一起互通應用,而是利用一系列相關範疇的資料集來產出推斷。就算兩個範疇之間的關聯本來較弱,我們也能使用深度學習的架構來連接這兩個範疇,通過數據分析產出合用的結果。

一個成功的例子可見於使用衛星圖像了解非洲大陸的貧窮狀況,這個研究的學術文章剛在近年發表。

衛星圖像和非洲大陸的貧窮狀況看似不太相關,但傳遞式遷移學習有助找出兩個不同領域資訊之間的關聯。(楊強教授簡報)
衛星圖像和非洲大陸的貧窮狀況看似不太相關,但傳遞式遷移學習有助找出兩個不同領域資訊之間的關聯。(楊強教授簡報)

發展普惠金融可開拓上億客源

現在再來談談如何將人工智能和金融服務放到一起。AI可以怎樣推動普惠金融的發展?我們必先理解到,金融往往涉及兩件事的平衡:高效能和低成本。如果要令某個項目的效能高,成本就會相應提高,而如果太側重於降低成本,項目的效率就提不上去。人工智能的出現有助企業更容易抓取這兩者之間的平衡,而機器學習則有助推動這方面的革新更快發展。

過去,金融只是少數人的工具,只有那些擁有財富的人能在偌大的銀行裏接受豪華款待,得到經紀提供的建議和投資理財服務。今天,AI令金融服務擴展到數以百萬計的人。就以通訊軟體微信(WeChat)為例,活躍用戶數以億計,銀行要是想擴大服務範圍、找到這般大量的新客戶,就要靠人工智能科技和互聯網來做到,讓普羅大眾也能得到資產狀況分析和投資建議等金融服務。

配合AI技術發展 做好把關迎機遇

我們也能察覺到人工智能發展的轉變:機器面對的不再是簡單、有規可循的情況(例如棋盤遊戲),變得更為着重情景所需(situation-based),系統模型因而變得更為複雜,涉及的運算原則數量從一兩百條增至動輒數以億計,比如regression model(回歸模型)和深度學習系統便是,遠超乎人類大腦所能理解和分析。

那麼,以往提供服務的主要工作要靠專業人士執行,現在則因分析過程複雜而要交給機器處理,人類的責任變成要與機器緊密合作並且把關,比如增設設定,令機器配合政府或相關監管機構的規例。

對於金融業來說,服務邁向個人化,也要用到很多技術來支援。從核實用戶身分、客戶信用分析到投資方面的量性分析,都可以應用人工智能科技。要發展互聯網金融(internet finance),一定要平衡風險,看到機遇和隱藏風險,制定相應措施和方案(intervention plan);如果因為涉及風險而不去發展這個新範疇,那就妨礙了企業擴展和營利。

AI令企業更了解用戶

騰訊曾與京東集團合作,透過微信來將幾類特徵(features)放到一起,一邊是用戶的特徵,一邊是產品的特徵。兩者運算起來,會牽涉到數以億計的特徵,機器學習系統能處理這麼大的資訊量,產出非常精確並個人化的結果,按用戶所需和偏好找出匹配的產品。

楊強教授提到騰訊與京東集團合作,以大數據分析來預測用戶較可能購買什麼商品。(楊強教授簡報)
楊強教授提到騰訊與京東集團合作,以大數據分析來預測用戶較可能購買什麼商品。(楊強教授簡報)

這裏要處理的資訊變得很快,新資料瞬間就刷成舊的,按這些資料建立的系統也因此很快過時;要解決這個問題,就要平衡多元性(diversity)和深度(depth),強化學習(reinforcement learning)的框架也非常有用。

在中國,將金融服務和實際情景兩者結合對發展小額信貸業務而言非常重要。相關的科技可用以防止市民借貸來償還舊債,免得生出惡性循環或像次按風暴的危機。

用戶怎麼使用貸款的訊息可以從支出時間和地點等資訊來得到,用戶的生活習慣(例如在星巴克買拿鐵咖啡)也是有用的資訊。貸方留意的不只是用戶某時某地的一筆交易,而是一系列的資金進帳和支出。

可以說,這個系統會貼身了解用戶,摸清楚他們所關切的利益,繼而令他們享用的服務愈來愈貼近所需。資訊隨着時日累積,系統會變成終端用戶的好幫手,儼如個人助理。

大數據、機器學習創新金融服務

要做到這樣,就要結合遷移學習、強化學習和深度學習的技術。一個例子來自京東集團──京東在中國等於外國的Amazon──集團推出了新措施幫助雞農辦理貸款。以前,雞農要養雞就要向銀行申請貸款,用來購買雞飼料等等。京東仔細分析並掌握了從購買雛雞到養成肉雞整個過程中不同階段的所需開支,發現頭幾天的小雞根本不用消耗太多飼料,雞農不必從養雞第一天就用到那麼多貸款。

調整借貸模式後,京東按養雞進度按日提供貸款,雞農為養一隻雞而付的貸款利息可降至6分錢,能大大節省傳統生產模式中隨着利息逐日增加的不必要成本。如何採集並準確分析這些場景相關的資訊,是金融科技和人工智能的大課題,以上提到的都只是部分例子。

總括而言,人工智能對金融科技發展至為重要,要靠大數據推動,也需要很強的電腦平台支援。

 

本系列文章:

科大圓桌論壇:金融科技中的AI人工智能

滑大教授:讓機器學習整理數據 帶動金融科技發展

楊強:AI可稱霸棋局 金融科技應用另有挑戰

本社編輯部