人工智能開啟作弊新時代？是時候改革學生評分方式

雖然許多人擔心先進的人工智能（AI）技術正在開創一個剽竊和作弊的新時代，但這些技術也為教育工作者提供了重新思考學習評估的機會，並讓學生參與更深入、更有意義的學習，從而提高批判思維等等。

AI技術勢不可擋

ChatGPT等公開可用的生成人工智能技術，為保持學術誠信帶來不少挑戰，絕大部分大中小學，甚至教育當局也為應否禁止使用AI，以及如何解決學術誠信問題非常煩惱。

本地高等學院，除了香港科技大學2023年3月初表明交給教授自決是否限制學生使用ChatGPT外，多校要求學生在使用相關工具前須獲得校方充許。香港大學2月率先宣布臨時禁止學生使用ChatGPT；嶺南大學亦採取相同的臨時禁制措施；中文大學則指理性使用AI工具有助提升教學素質，但同樣要求事前允許。然而，新加坡政府卻將在教育課程中加入AI工具教學，並讓公務員使用ChatGPT草擬文書。

筆者相信，其他國家的教育部門都在煩惱着一籃子的問題，因為ChatGPT推出僅兩個月，活躍用戶已估計達到1億人，國內知名搜尋引擎也預告推出聊天機械人，包括檢索與生成兩種功能。但無疑ChatGPT的出現為學校創造了一個良機，可以大幅改革傳統評估方法。

抄襲檢測軟件還有用嗎？

最近一項尚未經同行評審的研究發現，使用ChatGPT生成50篇論文，能夠逃避傳統的剽竊檢查軟件。網上流傳一間美國大學，有學生玩票地研發了一個程式，協助其他學生將答案抄襲後自動換位，包括故意犯錯，以逃避核實測試。

專注研究學術誠信的專家莎拉·伊萊恩·伊頓警告說，大學生的作弊行為可能被低估了。她估計在加拿大的大學裏，每年超過70000名學生曾購買作弊服務。現在的技術，不過是日新月異而已，但人性從來不變。即使有科技公司嘗試研發檢測軟件，也未能百分百保證文章是否生成。

既然ChatGPT這種技術必然普及，而暫時也未有能成功「擒拿」抄襲者的軟件，就唯有從考核的內容及形式那一邊去想想了。

如何改革學生評分方式？

由於篇幅所限，筆者只探討未來考核有何形式。因為要改革出題內容較為複雜，與本身教學的內容相互影響，希望將來有機會另文再作分享。

先舉一重要例子，數十年來，教師和大學教授嚴重依賴「一次完成」的論文作業形式，學生會被分配或要求從列表中選擇一個通用的論文主題，並在特定日期提交他們的最終作業。此類作業特別容易受到新的AI應用程式以及合同作弊影響，學生很容易便能購買一篇完整的論文。教育工作者需要重新考慮，此類的作業考核評分方式還切合時宜嗎？

退一萬步說，儘管這種模式仍然有用，但有研究表明，學生可以提交作業草稿供審查和反饋。這種形成性評估（formative assessment）做法，除了有助發現剽竊個案外，對指導學生學習也有積極作用。反饋可以由教師或學生自己提供；同學和自我反饋可以用來思考正在進行的作業，縱使是由AI軟件生成。

如此進行的話，整個過程可以參考「反轉課堂」（Flipped Classroom）的概念，晚上讓學生善用AI在內的各種工具尋找資料，第二天回校再分組討論，老師可以就每個步驟、他們的反饋評估得分。這樣一來，中期作業評估比期末作業更為重要，而學生由發展到總結想法都能夠得到評估。最後，教師可隨意隨堂抽取部分作業，請學生匯報。若他只是全部抄襲，可能只會啞口結舌。

未來的評估模式可以借鑒健康監測的概念，每個學生在學年終就有其詳細、整體的個人學習能力評估數據檔。

轉向更真實的評估或包括績效要素

一個良好的評估要求教育者在多種情況下觀察學生的學習情況，例如教育工作者可以邀請學生展示他們的作品或以研討會方式討論成品，最終目的是鼓勵學生通過另一種形式分享他們的學習成果。

在決定任何評估形式前，老師需要問「是否根本不需要論文？有沒有更真實的方法來有效地評估學生的學習？」當學生被要求這樣做時，他們必須在更實際的環境中應用知識，這通常會使AI工具變得不那麼有用。

總的來說，這些建議可能令評估更為耗時，尤其是在牽涉大量學生時，但它們確實提供了更好的學習和有利於不同評估形式，包括「形成性評估」與「總結性評估」（summative assessment）之間的協同作用。AI只會愈來愈融入社會，我們必須將之融入學習環境，納入我們的評估方法之中，產生更有效、更有價值的評估結果。

最後，大家又認為本文是否用ChatGPT扶助來寫成的呢？