AI自動作文技術先進但會影響語文學習

馬斯克（Elon Musk）創辦的人工智能（AI）公司OpenAI，於去年底推出ChatGPT。ChatGPT是一個聊天機器人系統，它是通過超大型語言模型GPT及深度學習運算法而開發的免費開放「自然語言處理」（Natural Language Processing, NLP）軟件（NLP是筆者研究領域）。ChatGPT一出台便引發全球科學界議論紛紛，科學家認為ChatGPT背後的先進人工智能技術毋庸置疑，他們擔心的是ChatGPT應用所產生之道德（ethics）上的問題。

人工論文可信度行內人亦難分真偽

古語有云「熟讀唐詩三百首，不會作詩也會吟」。ChatGPT最厲害的功能是自動寫作，用戶只要指定主題，系統便能生成層次清晰、字字珠璣的鴻文摘要。ChatGPT利用「深度神經網絡」（deep neural networks）技術，從數以億計的文章中學習，去模仿不同專家作者的寫作技巧；學習了之後，系統便可以基於特定題目，因應用戶需求創作出一篇或多篇不同風格的文章。再者，在學術應用方面，ChatGPT可以自動編寫出令人信服的虛假研究論文摘要。讓人驚訝的是，這些人工論文的可信度連行內科學家都難分真偽。

有研究人員要求ChatGPT根據發表在多份著名醫學界研究期刊（包括《美國醫學會雜誌》、《新英格蘭醫學雜誌》、《英國醫學雜誌》、《刺血針》和《自然醫學》等）上的選集，自動撰寫相應摘要。然後他們利用剽竊（plagiarism）檢測器及人工智能輸出檢測器，比較這些人工摘要與原始摘要，並要求一組醫學研究人員找出揑造的摘要。

結果，ChatGPT生成的摘要順利通過剽竊檢查器，而且測試中的原創得分中位數為百分之百，這反映出人工摘要並沒有被檢測到任何剽竊。而人工智能輸出檢測器發現了66%的生成摘要。但人類審稿卻沒有做得更好，他們僅正確識別了68%的生成摘要，及86%的真實摘要，換句話說他們錯誤地將32%的生成摘要識別為真實摘要，並將14%的真實摘要識別為生成的^（註）。

學生未能從寫作中好好學習

由於利用ChatGPT寫論文輕易而舉，學界擔心愈來愈多學生會走此捷徑，罔顧論文內容的科學性和創新點。然而有專家認為，這問題的出現不完全是因為學生「練精學懶」，很大部分理由是教育界太急功近利，無論是博士學生畢業或年輕教授申請升職，大學都是通過計算論文數量來判斷，而不太重視論文質量。從另一角度看，這種「數論文」文化對創科產業發展是巨大絆腳石，高等教育界不宜過分偏重。

再者，人工論文可能是全屬虛構，內容可能帶有偏見或錯誤信息，可以教壞學生。不過更甚的是，學生未能從寫作過程中好好學習，畢業後變成一個才疏學淺、見識不廣的庸碌之輩。

善用科技否則面臨「機器代人」

這現象不禁令筆者想起美國科學及文化作家Nicholas Carr的著作《膚淺者》（The Shallows），當中他提出，網民往往不經意地把自己的記憶外判（outsourcing memory）予互聯網。這是一件很危險的事，若然每次碰到問題時都習慣問下Google、百度等「老師」，過分依賴互聯網的話，人的學習和分析能力便會大受影響，人類世界便會變成文化真空。

筆者並非危言聳聽。「水能載舟，亦能覆舟」，且看計數機（calculator）普及化的影響。計數機似乎已導致這一代人變成「計算白癡」，但數學能提升邏輯思維，有助人在日常生活中排難解紛。因此，教育學很重要──老師必須讓學生知道如何善用互聯網、人工智能、大數據等科技。不然的話，普羅大眾經常擔心的「機器代人」時代便會很快來臨。

註：Holly Else, “Abstracts written by ChatGPT fool scientists”, nature, 12 Jan 2023

原刊於《明報》，本社獲作者授權轉載。