考試！考試？

幾周來關於生成式AI的討論，本來應該告一段落，要探索的話題還可以有許多，但是流行的話題，發展得很快；文章可以談的，也許已經是幾個星期前的過氣話題，難以追趕。有朋友說：「難以跟得太貼！」一些教師已經在用付費的GPT-4，還有人在試用許多聊天以外的軟件，也有人開始使用中國內地研發的生成式AI工具。「追趕」已經不是一個適切的用詞。

生成式AI發展的速度，包括研發、推廣、使用、討論、反思，是驚人的。筆者一直覺得，學術界很重視發表與出版，而且成為學術生涯的重要支點，但是要寫成出版一本書，起碼要幾年；學術期刊，傳統的出版周期，大概18至24個月；討論的東西，也許已經成為歷史。聰明的作者，或則選擇一些難以過時的話題，或則挑選一些鮮會有人會過問的話題，才可以逃過「陳舊」的命運。

在社會科學與人文學科，尤其如此。科學和工程的論文發表周期，稍微好一點，因為往往有爭奪知識產權與專利註冊的因素。COVID的出現，因為要應急，研究的新發現，只要是與疫情有關，一兩個星期就得到發表，出現了新的發表短周期。現在ChatGPT的傳播速度，又是新的一種速度，也是全新的平台。不知不覺之中，也許是元宇宙的一種形態吧！

生成式AI的應用，在教育以外，似乎存在已久。大體來說，引起注意，是它對人類的模擬，到了一個新的水平。因此，「取代人類」的恐懼，也許是引起熱烈討論的潛在原因。其中，因為生成式AI，不像上一代的機器人，主要取代人類操作性的「藍領」活動，從掃地、抹窗，到工廠流水線的加工，都是預先設好程序的「自動化」。而被取代的「藍領」人類，是沒有多少發言權的。

生成式AI對人類的模擬，到了一個新的水平。因此，「取代人類」的恐懼也愈來愈嚴重。（Shutterstock）

機器智能進犯白領

加進智能的元素，1997年IBM的深藍電腦戰勝了當時的國際象棋棋王，2016年AlphaGo戰勝世界圍棋冠軍韓國李世乭，人們開始認識到，機器是可以學習的，雖然學習的還是人類，是人類輸入了3000萬棋步；但是機器的速度與記憶量，卻可以超過人類。但是首先是可以模仿人類「隨機應變」的本領。機器不需要全面模仿人類，例如智能停車場、自動駕駛的汽車，它們只需要學會人類的某種本領，輸入足夠的數據，就能夠替代人類，雖然也只是替代人類的某個方面。

但是ChatGPT之所以震撼全球，是因為它進犯了人類「白領」的活動範疇。是向知識分子開戰，而知識分子，是很能發聲的。像前兩周本欄提到的，美國ABC電視台與研發ChatGPT的Sam Altman對質，記者關心的取代人類工作，也許不是關心流浪紐約街頭的失業者，而是大量被迫離職的低級律師、會計師、銀行從業員。ChatGPT雖然成為「聊天」工具，但是它可以生成的，遍及幾乎所有涉及文字的「出品」。而白領的生涯，基本上是靠文字。有些文字規格比較嚴格的行業，例如法律、會計，反而成為AI工具施展拳腳的最佳領域。就教育而言，前文提到的學校行政文書，其實不屬於教育範疇，只是屬於行政的必須，因此也容易被機器替代。

教育範疇還有不少是容易被機器替代的，例如大學的項目申報書、晉升申請書，只要給予詳盡的「指令」（prompt），對出品加以修輯，就能得心應手。這些，都只能說是把人手的文字工作簡化了，負擔減輕了，時間節省了。

AI工具已可為老師分憂，如代勞出題及批改。但學生都用的話，如何測到學生的真正能力？（Shutterstock）

教育擔憂在於考試

而目前最引起關注的，是教育。就目前筆者看到的香港教師的努力所及，備課、出題、批改，都可以要AI工具代勞，輕而易舉，也是屬於減輕負擔一類。不會引起巨大恐懼。

最大的恐懼，是學生的表現。理由是，學生都加入用AI工具了，就無法測到學生的真正能力。這就涉及學生成就的測評問題。簡而稱之，也就是考試。

最根本的問題是：為什麼要考試？我們馬上會說，不考試，怎麼知道學生學得怎麼樣？但我們不妨追問，我們希望學生學到什麼？我們希望學生學的，就是正規課程的那幾個科目（學習領域）嗎？一名學生從幼兒園到中六，他們的所學，就是校內外考試所考的嗎？想知道學生學得怎樣，是一個良好願望。那也許就是學理上的形成性測評（formative assessment），是協助學生學得更好的。但是，就算是平日的作業，我們的注意力，往往還是學生的對與錯；學生的注意點，也是分數；實際上變成了漸進式的總結性測評（summative assessment）。在華人社會，考試最終還是擇優、淘汰、分等……是為教育的社會功能服務，而不是為學生的學習服務。

這裏舉幾個反例。一、韓國在2016年開始，全部初中3年，必須有一個學期不考試，稱為「自由學期」，在這個學期，與社會各方面合作，引入大量的體驗學習。

二、新加坡從2020年起，取消小二生的年底考試，以及小一和小二的所有計分評估，校方只通過平時課堂作業、活動或小測，了解學習進展。另外，取消中一生的年中考試，並逐步廢除小三、小五和中三的年中考試。教育部長說，目的是降低對學業成績的過度偏重，減少學校計分測驗與評估考試次數，好讓校方得以騰出更多時間，展開互動性學習項目，更全面地栽培學生。

從以上兩個例子看，考試的確是妨礙學生全面發展的一道關卡。最直接的做法，還是盡可能減少考試，讓出空間，讓學生有更寬廣的學習天地。

新加坡從2020年起，取消小二生的年底考試，以及小一和小二的所有計分評估。（Shutterstock）

輔助學習有何不可？

三、香港20多年前的教育改革，其中深受國際矚目的，是把原來的3個公開測評──升中的學能測驗、中學會考、高級程度考試（AL）──改成一個，也就是DSE。這就把小學與初中釋放出來了。但是，目前小學還要「交分」，成為小學普遍的考試壓力。相信考試的，一定認為這是必須的。但這只是公開的測評。校內的種種測評，其頻率與強度，仍然在妨礙着學生的生活。於是要問，假如允許學生用AI工具輔助作答，也要求他們公開整個過程。有何不可？

四、一個大學的例子：筆者在哈佛教學的時候，深受同事John Willett（港大舊同事，也是港大碩士的師兄）的啟發。他教的是量化分析研究生課，美國學生都覺得難，但是他一個原來18人的班，可以引來近200人。

他的做法，在作業的繳交日期之前，學生可以無限次預交，他會逐一提供修改的建議，務求學生的作業達到最佳水平。我們對待AI工具的使用，不也可以如此嗎？

五、再說，博士生做論文，導師的取態，不也是一樣嗎？不只是個別輔導，還提供種種建議、資料、批評，目的也是希望學生的論文能夠做出最佳水平。真個是循循善誘，那是輔導博士論文的常態。這裏面，博士生採取了什麼參考材料，引用了什麼人的文章，導師應該非常明瞭，學生也要申明。在這些參考與引用之中，也有ChatGPT的貢獻，也申明了，又有何不可？這與抄襲、欺騙、作弊，完全拉不上關係。

筆者認為：假如把學生困在抄襲、作弊……的層面，他們就會停留於，迴避、懼怕、偷摸、取巧的心態。AI工具就會成為籠罩他們學習生活的一片不可捉摸的烏雲，成為AI工具的被壓迫者、受害者。他們就不會成為積極的、自信的使用者。

原刊於《信報》，本社獲作者授權轉載。