生成式AI非萬能 鸚鵡學舌而已

不論是第三或第四代,人工智能都是建基於機器學習。學習時所採用的訓練數據決定系統的「智能」,所謂「學什麼懂什麼」,系統是不會無中生有的,只會像鸚鵡學舌而已。

ChatGPT在全球工商業界掀起狂潮,文職人員使用此人工智能工具書寫報告、記者撰寫新聞、學校老師編寫教材、音樂家作曲作詞、電腦工程師編寫電腦程序等應用日見普及。無可否認,若妥善使用ChatGPT的話,可以大大提升工作效率。

基於這信念,市場對投資ChatGPT技術的公司都非常看好,例如微軟於今年初公布其搜尋器Bing將會採用ChatGPT技術,消息出街之後公司股票價格便節節上升。然而,ChatGPT是否會類似元宇宙般,是另一團市場虛火,有頭威無尾陣呢?答案現時仍然言之過早。

逐步追近機器代人目標

ChatGPT背後廣泛採用生成式人工智能(GenAI)技術。GenAI是一項顛覆性的創新科技,突破了人工智能的傳統應用。回顧人工智能發展歷史,第一代人工智能(AI1.0)於上世紀50年代面世;在達特茅斯會議中,科學家預言:「與人類具有同等智能水平的機器將會出現」。

今天該目標雖然還未完全達到,但經過多年全球電腦科學家的努力,成果(以ChatGPT為例)已漸漸成熟,逐步追近機器代人的終極目標。

AI於1.0時代的技術基於規則為主,但由於規則不足的原因,AI 1.0系統所能覆蓋的問題偏少,不夠全面,特別是未能應付一些新鮮的現象。為此,科學家在第二代人工智能(AI 2.0)引進機器學習技術,以數據驅動人工智能。比如,假設有一套AI 2.0系統曾事先「看」(學習)過大量與狗相關的照片,它之後便能從一張新輸入的動物照片中,識別出當中內容是否含有狗隻。隨着互聯網的飛速發展,促使大數據的產生。除了數量大之外,大數據變動快及多樣化,因此令到原始的機器學習算法力有不逮,大大影響AI 2.0技術的發展。

有見及此,再加上人工智能硬件技術的進步(如GPU),科學家利用深度神經網絡技術來提升機器學習效率,學界稱之為「深度學習」;因此,在第三代人工智能(AI 3.0)時代,人工智能的實用價值廣泛地提升,可以用作解決一些規模龐大的應用(例如AlphaGo)。AI 3.0開放了工商業界對人工智能功能的要求,不過它的應用局限於特定領域,例如AlphaGo只懂下圍棋,而不擅於其他棋盤遊戲。

人工智能建基機器學習

2016年美國AI科技公司OpenAI推出GPT大模型,提供多元化人工智能服務,開啟第四代人工智能(AI 4.0)之門,而生成式人工智能正是GPT大模型背後的「使能技術」。相比之下,第三代主要是預測式人工智能,例如識別動物照片的種類(是狗、貓、馬或其他),其他常用功能包括分類、聚類等。而顧名思義生成式人工智能接受用戶的「提示」,生成文字、語音或錄像等媒介表達輸出內容,例如用戶提出「中國首都是……」,GenAI系統便輸出「北京」。又例如,用戶提出「畫一隻在公園裏的小狗」,系統便以「公園」圖案作背景,加上「小狗」圖案,生成一張組合的圖畫。

由上述例子可見,第四代人工智能技術比第三代的先進。許多商人便利用這特點大肆吹噓,誇大生成式人工智能的功能,形容GenAI可具備自己的個性,自主創新創作,充當全自動的「AI藝術家」。但事實上,不論是第三或第四代,人工智能都是建基於機器學習。學習時所採用的訓練數據決定系統的「智能」,所謂「學什麼懂什麼」,系統是不會無中生有的,只會像鸚鵡學舌而已。

因此,嚴格而言,利用生成式人工智能開發的工具(例如ChatGPT、Midjourney)充其量只是一台拾人牙慧的「機器鸚鵡」。

原刊於《星島日報》,本社獲作者授權轉載。

黃錦輝