Wed Apr 23 2025 02:30:13 GMT+0000 (Coordinated Universal Time)

從 0 到 1:輝達成為唯一「軍火商」

奧特曼後來回憶,在一個夏日涼爽的黃昏時分,OpenAI 研究團隊完成一個關於規模法則的實驗,這個實驗呈現出用於訓練人工智慧的運算能力與其結果能力之間的關係,並產生一系列「完美、平滑的曲線」,這些指數曲線看起來更像是宇宙基本定律,而不是實驗數據。
撰文:周恒星(國際媒體Pandaily創辦人)

黃仁勳,這位手臂上有刺青、愛穿黑色皮衣的創業家,自 30 歲那年創立輝達以來,二十多年間經歷晶片半導體領域的起起落落。截至目前在美國市值一兆美元以上的公司當中,輝達是唯一一家曾兩次從高點下跌超過 85%的公司。

在標準電腦架構中,一個被稱為「中央處理器」(central processing unit, CPU)的微晶片承擔大部分工作。程式設計師編寫程式,這些程式將數學問題交給 CPU,後者一次產生一個解決方案。幾十年來,CPU 的主要製造商是英特爾,英特爾曾多次試圖將輝達逼出市場。黃仁勳說:「我絕不接近英特爾,」他形容他們之間的關係就像貓和老鼠:「每當他們靠近我們,我就抓起我的晶片跑掉。」

黃仁勳賭輝達的電腦晶片可以成為人工智慧的大腦,他決定將所有的籌碼放上賭桌。(Shutterstock)
 

黃仁勳決定用差異化產品與巨頭競爭,那就是「圖形處理器」(graphics-processing unit, GPU)。1999 年,輝達在上市後不久推出一款名為 GeForce 的顯示卡,也就是後人常說的GPU。與通用的 CPU 不同,GPU 將複雜的數學任務分解為一系列較小的計算任務,然後以平行運算的方法同時處理所有任務。CPU 就像一輛運送貨物的卡車,一次只能送出一個包裹;GPU 則像是一個遍布整個城市的摩托車隊。正是基於這種特性,GPU 可以完成複雜的運算,這是加密貨幣市場、深度神經網路以及大螢幕上呈現絢麗色彩所必需的。同樣的,這些科技可以讓殘酷的射擊遊戲無比逼真,讓自動駕駛汽車在沒有協助的情況下做出 S 形拐彎。它們可以賦予電腦視力、聽力、理解能力和學習能力。

很快的,一群人工智慧研究員發現輝達 GPU 在訓練神經網路過程中的潛力。2012 年,辛頓帶領兩位愛徒艾力克斯.克里澤夫斯基和伊爾亞.蘇茨克維推出 AlexNet。相較於 Google用 1 萬 6000 顆 CPU,AlexNet 只用 4 顆輝達 GPU,在學術界和產業界引發轟動。AlexNet完成電腦視覺領域的巨大突破,它成功證明深度神經網路(DNN)可以有效對許多物件進行分類,而增加訓練資料量可以提高 DNN 的有效性。開發和訓練這些神經網路需要大量運算資源,而且使用大規模並行的 GPU 訓練模型的時間,比單獨使用多核 CPU 訓練模型的時間更短。

黃仁勳敏銳意識到,輝達下一個成長機會在人工智慧領域。黃仁勳打賭輝達的電腦晶片可以成為人工智慧的大腦,他決定將所有的籌碼放上賭桌。黃仁勳後來回憶:「我們有幸退後一步,問自己這對電腦的未來意味着什麼。我們得出正確的結論,這將改變運算方式,這將改變軟體編寫方式,這將改變我們可以編寫的應用程式類型。」

黃仁勳將世界上第一台 DGX-1 作為禮物,送給馬斯克和 OpenAI 團隊!(Shutterstock)
 

黃仁勳開始積極布局針對人工智慧的 GPU。輝達差不多花 5 年時間製作出 DGX,這個GPU 重達 317.5 公斤,黃仁勳把它形容為一輛電動汽車。馬斯克聽說這個消息後,找到黃仁勳,表示 OpenAI 想要一個這樣的 GPU。於是,在 2016 年 8 月的一天,黃仁勳造訪 OpenAI在舊金山的辦公室。他在一間會議室裏將這台超級電腦(屬於最新推出的 DGX-1 系列)親手交給馬斯克。

那一刻,黃仁勳突發奇想,隨手拿起一支馬克筆,在這台超級電腦的機身上寫道:「為了伊隆和 OpenAI 團隊!為了電腦和人類的未來!我將世界上第一台 DGX-1 作為禮物送給你們!」寫完後,他把筆交給馬斯克和圍過來的 OpenAI 團隊成員,所有人逐一在主機殼上簽名。

DGX-1級電腦可以將深度學習的訓練速度加快 75 倍,使 CPU 性能提升 56 倍。(英偉達)
 

當天晚上, 馬斯克在 Twitter 上寫道:「十分感謝輝達和 Jensen。(黃仁勳的英文名)將第一台 DGX-1 超級電腦捐給 OpenAI,以推動 AI 科技的普及。」

DGX-1 超級電腦擁有高達 170 TFLOPS 的半精度浮點運算能力,相當於 250 台傳統伺服器,可以將深度學習的訓練速度加快 75 倍,使 CPU 性能提升 56 倍,報價 12.9 萬美元。根據黃仁勳的介紹,這個產品由 3000 人耗時 3 年時間研發出來,開發成本巨大。黃仁勳稱:「如果這個計劃只是為了打造一台這樣的超級電腦,那麼這個計劃的成本將高達 20 億美元。」

當時 OpenAI 和輝達都沒有解釋這台超級電腦的準確用途。但輝達聲稱,DGX-1 是為了處理深度學習等 AI 問題而量身打造的超級電腦。黃仁勳提到:「世界上第一台專為 AI 打造的超級電腦即將落腳在一家專注於開放式 AI 研究的實驗室,簡直是天作之合。」

此後幾年,隨着利用 GPU 訓練大模型成為產業共識,愈來愈多的公司開始追逐高端 GPU,導致 GPU 奇缺。馬斯克曾說,現在它們「非常難搞」。這些晶片成為淘金熱的鎬和鏟。

2022 年,黃仁勳第一次嘗試使用 ChatGPT,他讓它寫一首關於輝達的詩。ChatGPT 回覆的結果讓他很滿意:

輝達迎接挑戰。

憑藉強大的 GPU 和人工智慧,

正在拓展科技的邊界。

看到這首詩,黃仁勳開心的笑了,他知道自己賭對了。

隨着 AI 訓練的最大規模大約每 6 個月增加一倍,輝達成為這場戰爭裏唯一的「軍火商」。幾年後,隨着 ChatGPT 的走紅和輝達市值突破 3 兆美元(截至 2024 年 10 月),馬斯克和黃仁勳出神的看着這台超級電腦的照片在網路上流傳,背後是奧特曼寫在牆上的那句名言。那句名言的後半句是:「我們每個人都有責任把世界的命運寄託在自己身上。」

時代的鐘聲從遠處傳來,當演算法(Transformer 模型)、算力(輝達)和資料(網際網路)都萬事俱備的時候,一扇新時代的大門打開。

奧特曼後來回憶,在一個夏日涼爽的黃昏時分,OpenAI 研究團隊完成一個關於規模法則的實驗,這個實驗呈現出用於訓練人工智慧的運算能力與其結果能力之間的關係,並產生一系列「完美、平滑的曲線」,這些指數曲線看起來更像是宇宙基本定律,而不是實驗數據。

奧特曼和一群研究人員走到辦公室外,望着遠處的夕陽。他們一起意識到,通用人工智慧不僅可能實現,而且它的來臨可能比先前預期要快得多。奧特曼後來回憶說:

我們都在想,這一切真的會發生,不是嗎?

這就像是科學史上的一個轉捩點。

我們已經洞悉一種全新的事物,即將向全人類宣告它的來臨。

原刊於《奧特曼傳》,本社獲出版社授權轉載。

書籍簡介:

書名:《奧特曼傳:OpenAI執行長開啟生成式AI變革時代》
作者:周恒星
出版社:天下文化
出版日期:2025年2月

作者簡介:

國際媒體Pandaily創辦人。Pandaily成立於2017年,致力於向海外報導中國科技和商業新聞,海外社群媒體有數百萬關注者。

他是12年資深科技記者。《中國企業家》前科技記者和中國創新網站「極客公園」前主筆,採訪過一群全球科技領袖並保持長期交流。曾常駐矽谷多年,長期追蹤報導矽谷頂尖公司和先進技術,是第一個採訪馬斯克的中國記者,也是《鋼鐵人馬斯克》簡體中文版譯者。

他是美國佛羅里達大學資訊系統碩士,業餘衝浪教練。