ChatGPT去考科舉……

中國堪稱考試之故鄉。孫中山先生曾經說過，中國的考試，是世界上最早也是最有效的。孫中山當時指的，是科舉考試。筆者在四川閬中，看過貢院（考試院）的展館，可以重塑當年考試的全過程。

忽然想起，假如ChatGPT去考科舉，那一定是榜首。ChatGPT不過是聊天機械人（Chatbot）的一種，可以按照用者的問題、指示、意圖，創造出種種文字作品。因此稱為生成式人工智能（Generative AI，或Gen AI）。科舉考試如要高中（上榜也），一定要熟讀歷代聖賢之書，那對ChatGPT來說，毫無困難。科舉需要門生寫成文章，只要向ChatGPT提出方向，那也是瞬間的事。即使還要加上揣摩當今（皇上，最後定奪）意向，對於ChatGPT，也是毫無困難。所以說，ChatGPT去考科舉，一定高中。

科舉不是也要求要書寫嗎？那也不愁，已經有其他的生成式人工智能，可以寫出漂亮的毛筆字，而且可以準確地出自名家字體──顏體？柳體？不在話下。所以說，ChatGPT要是考科舉，可以說是手到拿來，而且是瞬間的事，不必關在小房間（稱為「號舍」），冥思苦戰。

現代的許多考試，比起科舉，不是更複雜了，而是更簡單了。這裏且不去研究考試的功能，這在本欄已經反覆探討過，此處不贅。針對生成式人工智能，值得乘機探討的，是考試的形態──考什麼？怎樣考？

考些什麼，科技都能應付！

第一、最簡單的是考記憶。傳統的教育，大多注重學生的記憶，全球如此。因此要學生背書、默書。語文如此，常識如此，甚至數學也可以如此。在印度，有些教師相信，朗讀50遍，就會記牢。1980年代在中國農村訪談，就經常聽到家長說：「我這個孩子就是笨，記不牢！」都是把「記牢」看得最重要，把記憶看成是理解，把人腦的裝載看成是知識的增長。因此要考記憶。

關於記憶的作用，人類的認識是漸進的。筆者初入行的時候，香港按照當時西方流行的看法，認為記憶一律都是「死記硬背」，是違背學習的做法。當時不准背乘數表，我們當教師的，沒有辦法之中，買來街上舊式的練習簿，背後有乘數表，才得保不失。現代的學習科學，研究人腦的運作，證明記憶、模仿、重複是學習的起點，是最低層次的學習。有了記憶的累積，才有運用的可能性。

音樂的練習曲，是最好的說明：經過重複的「操練」，形成腦對眼（樂譜）、耳（音準、旋律、節奏）、手（技法）的協調，也就是所謂「肌肉記憶」（muscular memory）；沒有這樣的記憶，就不可能演奏。中國的書法，也是經過不斷的臨摹，工多藝熟，直至熟能生巧。背唐詩，也是經過琅琅上口的背誦，通過記憶累積素材，日後可以融會貫通自己創作。但是這也說明，記憶是為了運用。

基本技能，科技都能取代！

但是把記憶作為考試的內容和目的，卻是另外一回事。第一、現在香港的小學，仍然像1970年代的升中試一樣，要孩子背成語、考成語，而且是孤立地一句一句地背和考。這就等於一個一個音符、或者一個一個音節去學音樂；一個一個字，甚至一筆一筆地學書法。離開了使用，這樣的記憶是沒有意義的。第二、假如小學的考試，一直都是考記憶，學生的智力，就停留在記憶；不會運用，記憶就沒有意義。這是一直以來的問題。

有了現代科技，網上的記憶量，遠遠超過人腦。人類還是否需要記憶？這其實是一個一直存在的問題，不過沒有引起多大的注意。有了計算器，還需要背乘數表嗎？還需要筆算、心算嗎？這是科技對教育一個基本的挑戰。於是有一個問題，人類懂得計算的起點，是筆算、心算，還是點按計算器？那為什麼日本許多小學還要學珠算（算盤）？

直至1970年代，香港會考（DSE的前身）有計算需要的科目，考試局提供《對數表》（也許很多讀者從未聽說過）；高班可以用計算尺。後來有了計算器，更有可以進行複雜計算的Texas Instrument。幾經周折安排，考生只能攜帶有製造商註明香港特許的計算器。科技的發明，那時候已經對考試造成威脅。

進一步說，學習數學就是為了懂得計算嗎？人們經常掛在口邊的，Literacy and Numeracy，就是識字與計算嗎？同理，有了語音書寫（而且可以寫不同的字體），人類還要不要學寫字？有了電子音樂，電子樂器也有記憶（君不見酒店大堂的自動鋼琴演奏），那人類還要不要學樂器？不管如何，考試要考學生的記憶，已經沒有多少意義。科技的發展，愈來愈多在取代很多基本的技能，就迫使我們要重新思考，學校裏面學生要學的基本技能，為的是什麼？

人們的心目中，從人類的智力來說，連起碼的四則都不會，可以說是一種終身的缺陷。但是數學還有更加深刻的意義，是人類探索自然界的重要基礎。學生識字，也是傳承與發展文化的必要基礎。科技的發明，可有涉及這些考慮？

第二、考訊息與知識。也就是考生需要一定的知識基礎，才能圓滿地回答考題。在科舉，是考來自前人的知識與智慧。在現代考試，其實是考驗學生是否熟悉正規課程裏面所包含的訊息與知識。筆者以前在中學教物理，起初需要考生牢記物理公式，後來試卷附上需要的公式。有了手機，就麻煩了，訊息與知識的素材，在網上唾手可得，考試考訊息與知識的素材，也意義不大。然而，為了維護考試的「尊嚴」（integrity），大多數考場乾脆就不准攜帶手機入考場。這其實已經有點怪異：習以為常的工具，到了考試反而禁用！考試與科技的矛盾，其實已經表面化。

第三、考創作及創造。目前在香港，社會科學與人文學科領域，純粹考記憶、訊息、知識的考題，已經愈來愈少。考學生的領會、發揮、創意的愈來愈多。在大學而言，愈來愈多的是「開卷考試」，或者集體創作。也就是學生不需要關在考場、在規定的時內，完成考試。

但是有了類似ChatGPT的生成式AI，就連開卷考試都受到挑戰，或者說沒有多少立足的餘地。大學之所以視之為威脅，就是因為難以作是否抄襲的判斷。「抄襲」是作弊，罪無可恕，是考試的最後底線。

有了類似ChatGPT的生成式AI，就連開卷考試都受到挑戰。（Shutterstock）

考試概念，如何與時並進？

近日在網上聆聽了香港大學教學促進中心的一個論壇，有800多人登記參加，裏面有教師，也有學生。意見紛呈，很多元，不過主流是覺得要設法與時並進。擔心的是對學生不公平。學生的作業或者論文中，ChatGPT的參與有多少？是否誠實申明？是否可以列為作者之一（美國大學已經有明令禁止）？都是大家關心的問題，但都不可能馬上有答案。

筆者有這樣的想法，與讀者切磋：學生的作業或者論文，絕對不會是純粹代表學生一個人的作品。裏面一定有聽課得來的、文獻中搜索而得的、導師的意見、同學的交流，等等。生成式AI的存在，不過是又一種輸入。第一、直到目前，ChatGPT的產品，並沒有權威性。使用者需要自己判斷。第二、總體來說，不應以防範作弊作為出發點，作弊而感到舒服的，到底是少數。積極地信任學生，讓學生自主自為，才會得出積極的方案。

但是，從上面的討論來看，受到衝擊的不只是考試的形態，而是考試本身。大膽地說，教育制度裏面的考試，是工業社會生產流程中質量控制的性質。把考試看成是一個學習階段的終結，就會對於作弊之類的問題耿耿於懷。假如去掉控制的意念，把考試看成下一個階段的起點。面對日益發展的科技，也許就不再是消極地應付。

本文得到蕭文強與蔡熾昌幫助，謹此致謝。

原刊於《信報》，本社獲作者授權轉載。