John Hennessy教授：人工智能長足進步合理使用可改善人類福祉

資訊科技的發展，微處理器、個人電腦、互聯網和萬維網的出現，改變了社會和人類的生活。建基於深度神經網絡的機器學習的應用，將與上述的早期創新發明，對人類生活有着同樣的重要性，甚至具有更深遠、更具顛覆性的社會影響。

不久前，在香港大學陸佑堂舉行的首屆香港大學校長論壇上，電腦系統結構領域的先驅、美國電腦協會（ACM）2017年度圖靈獎得主、史丹福大學前校長John Hennessy教授，就「深度學習革命」進行主題演講，對建基於深度神經網絡的機器學習，以及深度學習對社會的影響發表專家見解。

John Hennessy教授指出，對今天談論科技的電腦科學家來說，人工智能是一件大事。「我們說人工智能，指的實際是機器學習，以及一種基於深度學習的機器學習形式。為了解釋這項技術，我將為大家上一節很簡短的課，它會讓大家了解這項技術帶來的一些真正挑戰、缺點和潛在的社會問題。」他說。

John Hennessy教授 ( 左二 ) 參與由港大校長張翔教授 ( 右一 )主持的討論。( 香港大學圖片)

Hennessy教授表示，深度學習的主意，建基於人類大腦如何工作的粗略模型。「我們構建了所謂的人工神經元，其運作方式與我們大腦的神經元不同，遠沒有那樣複雜。它們主要擁有大部分的連接能力，但是這些人工神經元是分層結構的，所以叫深度學習，因為在輸入和輸出之間可以有很多層神經元。輸入可能是你想要表述特徵的東西，例如，你想要表達的一組圖像是狗、貓、魚或是大象，以及一組輸出——狗、貓、魚、大象。這些神經元網絡使用一組權重組合數據，將數據相加，並得出結果。那麼它們是如何工作的呢？大多數東西都使用了所謂的監督學習。在監督學習中，我們有一個數據訓練集，一組我們想要學習的東西。監督學習背後的想法，是採用我們輸入的內容，我們擁有的訓練集，訓練這些神經元網絡，以便令該訓練集得到正確的答案。所以你必須擁有『真相』（ground truth），這非常重要，『真相』必須存在。這個訓練過程一直持續下去，最終我們得出了一組加權的訓練數據，這對得到正確答案很重要。我們放了一張貓的照片，上面寫着貓，不是狗，而是寫着貓」。

所以這個訓練過程使用了一種叫做反向傳播的技術。「我們所做的是獲取所需的輸出，我們試圖找出來，然後將數據移回原處，如何設置權重是關鍵。這是一張小圖，只有10個或20個，這裡可能有100個加權數據，200個加權數據。但是這些大規模的神經元網絡有十億、幾十億的加權數據，而且有很多很多層次，20至30層。因此，就我們所說的規模而言，它們非常大。因此，我們執行確定權重的過程。然後一旦我們完成了，我們就使用這個神經元網絡來演算數據。因此，例如，也許我們想對電子郵件進行分類，是垃圾郵件，還是促銷郵件，還是釣魚郵件，所以最好小心，它是垃圾郵件還是真正重要的東西。假設這是來自朱棣文教授的電子郵件，我想讀一讀，這是馬斯克（Elon Musk）發來的郵件，也許我也想讀一讀。所以我們花時間建立了這個模型，它可以為我們分類數據，然後譠我們演算，這樣演算快很多，因為已經設置了權重。所以我們要去做的就是做乘數。所以，這基本上是一個巨大的經典矩陣運算法問題罷了」。

人工智能成為專業人員的輔助工具是未來趨勢

他續說，「這就是機器學習技術的工作原理，雖煞有很多問題未解決。深度神經元網絡僅與訓練集一樣好。任何偏見、任何錯誤、訓練集中存在任何不好的東西，都會被融入神經元網絡，包括令人不快的評論、你不想重複的東西、存在的不正確的東西，都被融入網絡。這裏沒有真理的概念，這不是說真話的機器，它不知道真相，它知道從某種意義上來說，能從訓練它的數據學到一些什麼。這裏有一個挑戰，你想充分訓練它，但它能夠是通才；你希望它能夠對從未見過的事物作出推斷。當然，你可以向它展示世界上每隻貓、狗、魚、大象的每一張圖片，你可以建立一個神經元網絡來記住所有這些圖片的特徵，但那不是你真正想做的。你想在較小的範圍訓練它，然後用它來做與眾不同的事情」。

Hennessy說：「然後是它們不太擅長解釋事實。如果你問它為什麼是貓，它不會說貓有尖尖的耳朵、毛茸茸、捲曲着尾巴。它會說，因為在統計上它看起來像你告訴我叫貓的東西，所以這是一個真正的問題。想想醫學診斷，假設你用這樣的機器學習系統做醫學診斷，它告訴你，你有一些可怕的疾病。你不只是想知道你是否患有可怕的疾病，因為你的特徵看起來像其他患有可怕疾病的人。你希望對於正在發生的事情有更科學的解釋。這就是為什麼在許多情況下，尤其是在生命攸關和以人為本的情況下，這些人工智能工具不會完全取代專業人員，它們將被專業人員用作工具」。

「然而，令人驚訝的是這一領域有多個突破，我們能夠做一些事情。作為一名電腦科學家，我擁有 45 年的資歷，我見證了微處理器、個人電腦、互聯網、萬維網、流動裝置的誕生，人工智能比之前任何一項都發展得更大、更快，事情已經發生了變化。造成這個變化的原因僅僅是對該領域的令人難以置信的搜索。但我們已經解決了我們從未想過可以解決的問題。圖像識別，足以接近自動駕駛汽車。我們會到達那裏，我們很快就會到達那裏。 AlphaFold，一種深度思維的程式，可以進行蛋白質折疊，並可能通過近二十年的研究加速蛋白質折疊。在進行詳細圖像分析時進行圖像識別。因此，查看皮膚損傷並確定它是否是癌症，查看射線照片並確定該特定患者是否有問題。這些是電腦能真正做得好的事情，因為電腦會花大量時間查看細節，而人們不一定喜歡這樣做。同步翻譯的發展簡直令人震驚。我認為將來電腦翻譯很難不取代所有進行翻譯工作的人。」

演算法的突破成就ChatGPT

為什麼人工智能會突然迅速地流行起來？Hennessy教授認為，人工智能長期以來一直未能實現其一些最有野心的目標，但在過去十年，它實現了其最具雄心的目標。事情的發生有幾個原因：首先是演算法的突破，包括反向傳播技術及其他一些技術、深度學習和強化學習等學習模式，導致最近出現了大型語言基礎模型，如ChatGPT 及其他相關的、我們稱之為基礎或大型語言模型的東西。然而，另外兩個因素絕對是至關重要的──人工智能需要訓練的海量數據，真正海量的數據。萬維網、維基百科，所有這些數據都可用於訓練，以及大量用於訓練的電腦資源。「因為ChatGPT這些大模型有幾千億個作為權重的參數，所以你想想這個網絡有多大」。這意味著要創建專門用於訓練的電腦，而在世界上最快的電腦上訓練一個新模型需要幾個月時間。

Hennessy教授續說，一旦訓練了基礎模型，就可以應用微調的技術，它不需要重新訓練整個模型，這絕對是關鍵，因為科學家希望能夠做的事情之一，就是將世界上發生的新事物，更新到模型中。「我該怎麼辦？就是應用微調來添加額外的數據，但毋須重新訓練基礎模型，這很重要」。

他說，嘗試過 ChatGPT或者 Bard的人，都會對這些系統的工作效率感到驚訝。它們將理解自然語言與知識庫結合在一起：它們接受了大量數據的訓練，ChatGPT 基於 GPT3，它接受了 45 TB的文本訓練，大約是 20000 套維基百科，所以這是一個巨大的信息量。當然，即使是最優秀的人在十次生命中也無法消化，所以這是一個驚人的信息量。它們使用一種稱為 transformers 的技術，transformers 背後的想法，是預測下一件事、下一個短語、下一個語句，這是這種方法的基礎。

他又說，生成式模型正在爆炸性增長，但沒有真相檢測，你必須以其他方法進行「毒性預防」；你必須消除偏見。它通常是這樣完成的：一旦訓練了這個模型，你就得使用所謂的強化學習，你基本上是人手訓練它。「你讓某人做一些不以那種方式回答的事情，然後你告訴模型不要給出那個答案，而改變了回答方式的模型，基本上是用這個微調的做法讓模型恢復原狀的」。

人工智能驚人的學習能力

Hennessy教授說，還有其他有趣的問題，例如版權問題。如果這個模型是由大量數據訓練的，其中一些數據是版權所有的，那麼這個模型，如果它是一個生成模型，將以某種方式使用這些信息，那麼版權還有什麼意義呢？它實際上是複制了內容，還是只是改寫了短語，如果您以直接的方式改寫，在世界某些國家/地區是侵犯版權的。另外，這些生成模型也可用於生成圖像和視頻，人們會看到很多生成圖像模型。「我希望將來 PowerPoint 演示不會由人們寫下要點並查找圖像來製作，這一切都將在未來以某種自動方式發生。生成視頻將是一個巨大的突破，因為無論是遊戲、電影還是其他任何東西，製作視頻的成本都非常高。利用生成模型，可以在效率方面取得巨大突破。

那麼，Hennessy教授是怎樣想的呢？他認為，人工智能取得了巨大的進步。這些大型語言模型使人們相信，人工智能將夠幫助人們完成各種文本。對於大多數非專家的人來說，這些模型已經足夠好，這是一個了不起的成就。但在許多方面，它們的學習能力仍然不如人類。與這些機器的學習方式相比，人類擁有一些在某方面仍然非常有效而且特別節能的學習方式。大腦的耗能大約是 20 至30 瓦特，而數據中心耗用的能量約是大腦的一千倍。人工系統確實具有優勢，它們可以驚人的速度學習，因為只是使用運算能力來學習。因此，如果從下棋的深度思維看，Alpha Zero只學習下棋的規則，沒有任何策略。Alpha Zero與自己進行了 1900 萬場比賽，遠遠超過任何大師一生中參加過的比賽，然後它成為世界上最好的國際象棋棋手，而這只需要 24 小時。因此，就如何使用這項技術而言，這裏存在權衡取捨。人類面臨的挑戰是思考如何利用這種深度學習人工智能技術，並以改善全球人類生活的方式使用它，「這就是我們所有人都將面臨的挑戰，因為這不僅是技術的挑戰，還是社會的挑戰。」