要打造香港成為國際創科中心,官、產、學、研、投各界必須攜手着力建設「數據、算法、算力」三大關鍵技術平台。例如,專家估計2024年互聯網上的數據多達150皆位元組(Zettabyte, ZB, 1021);又例如,生成ChatGPT-4的深度學習網絡利用了1.8兆個參數;要高效地處理那麼龐大的數據及參數量需要龐大的算力,遠遠超於傳統電腦系統所能及。因此,全球計算機科學家及工程師都在埋頭苦幹地研發「高性能計算」(High Performance Computing, HPC)技術。
HPC 是指使用超級電腦或大型計算機集群,以大規模的計算能力來解決複雜的問題(例如生成式人工智能, GenAI)。許多前沿科技(例如大型語言模型, LLM)都需要龐大的算力來進行數據分析和模擬,只有通過HPC 才能有效處理並達成目標。HPC 的挑戰在於其本身對於很多種技術有很高的要求︰硬件方面,建立超算中心需要高性能的處理器、大量的儲存空間和穩定的網絡設施;軟件方面,需要專門的管理組織軟件、算法和優化工具來充分發揮硬體的計算能力;還要有能夠有效操控現代計算技術的人力資源。因此,HPC 是一項非常複雜且需要大量資源投入的工程。
特區政府於2022年底發表了《香港創科發展藍圖》,提出人工智能、生命健康科技,以及先進製造與新能源科技為三大聚焦產業,這些領域都與HPC有着密不可分的關係。人工智能(AI)是目前創新及科技界最熱門的話題,尤其是生成式人工智能(如ChatGPT)等系統風靡全球。連今年的諾貝爾物理學和化學獎也都與人工智能息息相關,顯示出人工智能在科研中的巨大影響力。人工智能技術的基礎便是HPC,像ChatGPT這樣的人工智能模型,是建立在由數萬個「圖形處理器」(GPU)及「中央處理器」(CPU)組成的一個巨大的「超級大腦」,用來處理海量的文本、圖像和數據。最近,特斯拉總裁馬斯克(Elon Musk)甚至建立了一個由十萬個GPU組成的超級計算集群,以進一步發展人工智能技術。
生命健康科技也是《香港創科藍圖》中的重點發展方向之一,而這個領域同樣需要HPC 支援。以諾貝爾化學獎背後的關鍵技術 AlphaFold 為例,它利用高性能計算成功解決了蛋白質結構預測的超級大難題,這一突破對於生命科學和醫藥研發具有劃時代的意義。基因組學、大數據分析和生物訊息學的研究,都需要巨大的計算能力來進行數據處理和建模分析。因此,HPC在生命健康科技的研究中不可或缺。再看先進製造與新能源科技發展,在製造業中,從計算機輔助設計(CAD)到計算機輔助工程(CAE),再到晶片設計,這些都依賴於HPC的精確模擬和數據分析。又例如在能源領域,核聚變作為最具前景的清潔能源解決方案,也需要大規模的數值計算來模擬核反應過程,對HPC 有巨大的需求。
凝聚HPC持份者組業界生態圈
為了應對創科對於HPC的需求,香港政府近年來加大了對HPC的投資,在美國禁運之前購買了數千張 Nvidia 的先進GPU卡,用於香港建立一個擁有300多個計算節點的超算中心(Supercomputer Centre),期望不久將來能向科研社區開放。然而,建設一個超算中心並非易事。正如中國工程院倪光南院士在最近的演講中所指出,建設一個大型高性能計算集群是一個複雜系統工程,具有多層次性、動態性和不確定性等特徵。
每一個科研創新機構對計算資源的需求都是動態變化的,拆分成小集群後,既不能有效處理大型科研項目,又容易造成資源閒置。超算中心的主要價值在於能夠將眾多不同規模的科研項目整合起來,以最有效方式分配組合使用計算資源。中國內地近年來建設了多個大型超算中心,深圳市亦不甘後人,它們的經驗和技術的確很值得香港借鑑。
在香港推動高性能計算,除了超算中心的建設之外,還有兩個重點:一是 HPC 生態環境的建設,二是HPC人才的教育和培養。在建設HPC生態環境方面,長期以來不少政府部門,例如天文台進行天氣預報、環保署研究污染、醫管局的醫療大數據分析等,都大量使用 HPC;大學科研單位在許多研究領域中也經常使用;近年來,隨着AI應用的興起,工商業界對計算資源的需求更是急劇增加。由此可見,當前是一個適合時機,凝聚香港官、產、學、研各界的HPC 持份者,組織一個有機、互動的業界生態圈,配合香港政府對創科及高性能計算的投入。為此,筆者聯同與一眾 HPC 志同道合人士創辦了香港高性能計算學會,旨在為香港建設一個 HPC 的互動交流平台,讓各界習思廣益,一同推動香港HPC的應用、研發及人才培養。
原刊於《信報》,本社獲作者授權轉載。