AI自動作文技術先進 但會影響語文學習

作者認為,教育學很重要──老師必須讓學生知道如何善用互聯網、人工智能、大數據等科技。不然的話,普羅大眾經常擔心的「機器代人」時代便會很快來臨。

馬斯克(Elon Musk)創辦的人工智能(AI)公司OpenAI,於去年底推出ChatGPT。ChatGPT是一個聊天機器人系統,它是通過超大型語言模型GPT及深度學習運算法而開發的免費開放「自然語言處理」(Natural Language Processing, NLP)軟件(NLP是筆者研究領域)。ChatGPT一出台便引發全球科學界議論紛紛,科學家認為ChatGPT背後的先進人工智能技術毋庸置疑,他們擔心的是ChatGPT應用所產生之道德(ethics)上的問題。

人工論文可信度 行內人亦難分真偽

古語有云「熟讀唐詩三百首,不會作詩也會吟」。ChatGPT最厲害的功能是自動寫作,用戶只要指定主題,系統便能生成層次清晰、字字珠璣的鴻文摘要。ChatGPT利用「深度神經網絡」(deep neural networks)技術,從數以億計的文章中學習,去模仿不同專家作者的寫作技巧;學習了之後,系統便可以基於特定題目,因應用戶需求創作出一篇或多篇不同風格的文章。再者,在學術應用方面,ChatGPT可以自動編寫出令人信服的虛假研究論文摘要。讓人驚訝的是,這些人工論文的可信度連行內科學家都難分真偽。

有研究人員要求ChatGPT根據發表在多份著名醫學界研究期刊(包括《美國醫學會雜誌》、《新英格蘭醫學雜誌》、《英國醫學雜誌》、《刺血針》和《自然醫學》等)上的選集,自動撰寫相應摘要。然後他們利用剽竊(plagiarism)檢測器及人工智能輸出檢測器,比較這些人工摘要與原始摘要,並要求一組醫學研究人員找出揑造的摘要。

結果,ChatGPT生成的摘要順利通過剽竊檢查器,而且測試中的原創得分中位數為百分之百,這反映出人工摘要並沒有被檢測到任何剽竊。而人工智能輸出檢測器發現了66%的生成摘要。但人類審稿卻沒有做得更好,他們僅正確識別了68%的生成摘要,及86%的真實摘要,換句話說他們錯誤地將32%的生成摘要識別為真實摘要,並將14%的真實摘要識別為生成的(註)

學生未能從寫作中好好學習

由於利用ChatGPT寫論文輕易而舉,學界擔心愈來愈多學生會走此捷徑,罔顧論文內容的科學性和創新點。然而有專家認為,這問題的出現不完全是因為學生「練精學懶」,很大部分理由是教育界太急功近利,無論是博士學生畢業或年輕教授申請升職,大學都是通過計算論文數量來判斷,而不太重視論文質量。從另一角度看,這種「數論文」文化對創科產業發展是巨大絆腳石,高等教育界不宜過分偏重。

再者,人工論文可能是全屬虛構,內容可能帶有偏見或錯誤信息,可以教壞學生。不過更甚的是,學生未能從寫作過程中好好學習,畢業後變成一個才疏學淺、見識不廣的庸碌之輩。

善用科技 否則面臨「機器代人」

這現象不禁令筆者想起美國科學及文化作家Nicholas Carr的著作《膚淺者》(The Shallows),當中他提出,網民往往不經意地把自己的記憶外判(outsourcing memory)予互聯網。這是一件很危險的事,若然每次碰到問題時都習慣問下Google、百度等「老師」,過分依賴互聯網的話,人的學習和分析能力便會大受影響,人類世界便會變成文化真空。

筆者並非危言聳聽。「水能載舟,亦能覆舟」,且看計數機(calculator)普及化的影響。計數機似乎已導致這一代人變成「計算白癡」,但數學能提升邏輯思維,有助人在日常生活中排難解紛。因此,教育學很重要──老師必須讓學生知道如何善用互聯網、人工智能、大數據等科技。不然的話,普羅大眾經常擔心的「機器代人」時代便會很快來臨。

註:Holly Else, “Abstracts written by ChatGPT fool scientists”, nature, 12 Jan 2023

原刊於《明報》,本社獲作者授權轉載。

黃錦輝