
DeepSeek-R1 LLM 於達沃斯論壇亮相,效能媲美 GPT-4,成本卻大幅降低。同時,DeepSeek的開源做法獲得全球推崇,一致認為此舉對達至全民通用人工智能非常關鍵。

DeepSeek開源大型語言模型DS-R1,效能超越ChatGPT,價格更具優勢。其潛在注意力機制及混合專家系統提升效率,開源策略促進社群協作。香港政府可藉此契機,利用公開數據建立開源AI平台,擺脫對OpenAI依賴,提升本地科研水平。

中大醫學院已成功利用文字配對演算法分析新冠病毒與疫苗接種之間的變化,及以ChatGPT準確識別網上的新冠病徵文字記錄。專家表示,下一波大流行出現前,可藉AI作出前瞻性預測,及早調節醫療配套。

雖然開發LLM是一個複雜的過程,但它卻是理解和解釋語言資料的重要工具。按照下文簡介的步驟,你就能開發出既能滿足需求,又能確保資料安全的LLM。

大型語言模型(LLM)背後的運行機制到底還代表什麼?也許不像人一樣在思考,但是在部分領域,它表現得像人一樣有邏輯推理的能力,這對於我們未來,就會產生非常根本性影響。

筆者覺得大數據和大型語言模型(LLM)之間存在許多相似性,可以通過大數據的「4V」特性來理解:Volume(體量)、Velocity(速度)、Variety(多樣性)和Veracity(真實性)。