隨着硬件和軟件的不斷進步,人工智能已成為全球炙手可熱的科研領域,商業市場亦非常看好,例如科技產業諮詢公司Gartner估計,人工智能軟件市場於2025年的增長率將會為31%,總值達1300多億美元;研究機構國際數據公司(IDC)亦預測,全球人工智能市場規模將在2021年達到880億美元,並在2025年增長至2200億美元,5年複合增長率(CAGR)約為26.2%,而中國市場規模將以24.4%的CAGR增長,在2025年將超過180億美元,佔全球總規模8.3%,位列全球第二。
「燒錢」研技術 成效遲遲未見
再者,過去10年全球大學科研也衍生了不少人工智能的初創公司,不少更獲得投資者的垂青,搖身一變成為「獨角獸」企業,也有一些公司可以更上一層樓,成功融資上市。然而,近期人工智能產業發展熱潮卻出現變化,多間上市公司股價持續下滑,據傳媒報道,內地人工智能產業於2015年至2021年合共融資逾萬億元人民幣,儘管國家推出各類支持政策,但是行業依舊處於大面積虧損狀態。
在商言商,人工智能公司過了首階段(蜜月期)之後,投資者也必然要看業績,因此會不停找公司「照肺」,要求它們「交數」。但有專家分析,市面上有不少已上市的人工智能公司,仍然在不斷地「燒錢」,投放大量資源在技術研發上,但成果的實際成效卻遲遲未能顯現,企業往往顧此失彼,忽略了技術的商業效益,導致公司帳目長期持續見紅,處於入不敷支的狀態。
開發4步驟 涉數據算法交付
科技經濟專家認為,世界各地應該避免同類事件再次發生,因此人工智能公司必須重新平衡發展目標,減研重商,加大商業投資,促進科研成果落地。不謀而合地,最近中國信息通信研究院發布《2022年人工智能白皮書》,指出未來人工智能產品工程化將會是成功企業的關鍵因素(CSF)。企業在追求持續研發新技術的同時,將更加注重產品開發過程,以規範的工程手法確保產品安全可信。
從工程化角度看,人工智能開發項目並非從零開始搭建,否則開發周期和項目成本都很難掌控。類似軟件工程,當前人工智能工程師常會採用既定模型,之後輸入適當的應用場景數據,進行模型訓練和優化。概括而言,人工智能系統的開發周期包括4個步驟:數據處理、模型設計及優化、模型評估及調整、實施部署,然而這些工程步驟並非免費,當中牽涉以下成本:
(一)數據成本:應用數據內容處理頗複雜,它不僅包括原始數據的獲取或購買,還包括將數據整理成人工智能模型可識別的類型,甚至還要對數據進行裁剪、修改等增潤工作,才能形成適合的數據。高質量的數據是算法模型成功的保障,但是數據處理並非一個技術問題,處理過程雖然簡單,但往往需要大量人力,因此數據標注行業已成為經濟相對落後地區的重點發展產業。
(二)算法成本:包括具體應用模型的設計及開發所產生的支出,主要體現在工程師的人力成本和模型訓練所必須的硬件(例如CPU和GPU)的投入。
(三)交付成本:指的是在模型驗收和實施部署階段,不能一次性成功交付、需要反覆調整而產生的支出。以一般項目為例,一次性通過率通常不足6成,如果無法一次性成功交付的話,項目便需要補充數據和算法人員,甚至需要二次開發,這無疑會增加項目成本。
投機前車可鑑 散戶血本無歸
綜合而言,一般人工智能項目的成本為數據佔六成、人力二成、硬件及後續調整二成。在各項成本中,人力成本因為供不應求及市場競爭原因,短期內不存在下降的可能性,而只要深度學習底層框架不變,數據成本就呈現絕對剛性。由此可見,由於成本可下降的空間有限,人工智能產業發展甚具挑戰性。
從宏觀分析,人工智能企業看上去與上世紀末科網公司被利用作為投機炒賣的工具非常類似,結果市場泡沫爆破,導致許多中小型投資散戶血本無歸。令人氣憤的是,當時善於玩弄財技的金融大鱷卻從中賺到盆滿缽滿,這現象對全球創新科技產業發展大潑冷水,而香港也是嚴重受害者之一。人工智能是香港4大創科發展範疇之一,前車可鑑,政府必須加倍謹慎,防止「人工智能泡沫」的形成和爆破。
原刊於《香港經濟日報》,本社獲作者授權轉載。