ChatGPT去考科舉……

現代的許多考試,比起科舉,不是更複雜了,而是更簡單了。這裏且不去研究考試的功能,這在本欄已經反覆探討過,此處不贅。針對生成式人工智能,值得乘機探討的,是考試的形態──考什麼?怎樣考?

中國堪稱考試之故鄉。孫中山先生曾經說過,中國的考試,是世界上最早也是最有效的。孫中山當時指的,是科舉考試。筆者在四川閬中,看過貢院(考試院)的展館,可以重塑當年考試的全過程。

忽然想起,假如ChatGPT去考科舉,那一定是榜首。ChatGPT不過是聊天機械人(Chatbot)的一種,可以按照用者的問題、指示、意圖,創造出種種文字作品。因此稱為生成式人工智能(Generative AI,或Gen AI)。科舉考試如要高中(上榜也),一定要熟讀歷代聖賢之書,那對ChatGPT來說,毫無困難。科舉需要門生寫成文章,只要向ChatGPT提出方向,那也是瞬間的事。即使還要加上揣摩當今(皇上,最後定奪)意向,對於ChatGPT,也是毫無困難。所以說,ChatGPT去考科舉,一定高中。

科舉不是也要求要書寫嗎?那也不愁,已經有其他的生成式人工智能,可以寫出漂亮的毛筆字,而且可以準確地出自名家字體──顏體?柳體?不在話下。所以說,ChatGPT要是考科舉,可以說是手到拿來,而且是瞬間的事,不必關在小房間(稱為「號舍」),冥思苦戰。

現代的許多考試,比起科舉,不是更複雜了,而是更簡單了。這裏且不去研究考試的功能,這在本欄已經反覆探討過,此處不贅。針對生成式人工智能,值得乘機探討的,是考試的形態──考什麼?怎樣考?

生成式人工智能已可以寫出漂亮的毛筆字。(Shutterstock)
生成式人工智能已可以寫出漂亮的毛筆字。(Shutterstock)

考些什麼,科技都能應付!

第一、最簡單的是考記憶。傳統的教育,大多注重學生的記憶,全球如此。因此要學生背書、默書。語文如此,常識如此,甚至數學也可以如此。在印度,有些教師相信,朗讀50遍,就會記牢。1980年代在中國農村訪談,就經常聽到家長說:「我這個孩子就是笨,記不牢!」都是把「記牢」看得最重要,把記憶看成是理解,把人腦的裝載看成是知識的增長。因此要考記憶。

關於記憶的作用,人類的認識是漸進的。筆者初入行的時候,香港按照當時西方流行的看法,認為記憶一律都是「死記硬背」,是違背學習的做法。當時不准背乘數表,我們當教師的,沒有辦法之中,買來街上舊式的練習簿,背後有乘數表,才得保不失。現代的學習科學,研究人腦的運作,證明記憶、模仿、重複是學習的起點,是最低層次的學習。有了記憶的累積,才有運用的可能性。

音樂的練習曲,是最好的說明:經過重複的「操練」,形成腦對眼(樂譜)、耳(音準、旋律、節奏)、手(技法)的協調,也就是所謂「肌肉記憶」(muscular memory);沒有這樣的記憶,就不可能演奏。中國的書法,也是經過不斷的臨摹,工多藝熟,直至熟能生巧。背唐詩,也是經過琅琅上口的背誦,通過記憶累積素材,日後可以融會貫通自己創作。但是這也說明,記憶是為了運用。

有了記憶的累積,才有運用的可能性。(Shutterstock)
有了記憶的累積,才有運用的可能性。(Shutterstock)

基本技能,科技都能取代!

但是把記憶作為考試的內容和目的,卻是另外一回事。第一、現在香港的小學,仍然像1970年代的升中試一樣,要孩子背成語、考成語,而且是孤立地一句一句地背和考。這就等於一個一個音符、或者一個一個音節去學音樂;一個一個字,甚至一筆一筆地學書法。離開了使用,這樣的記憶是沒有意義的。第二、假如小學的考試,一直都是考記憶,學生的智力,就停留在記憶;不會運用,記憶就沒有意義。這是一直以來的問題。

有了現代科技,網上的記憶量,遠遠超過人腦。人類還是否需要記憶?這其實是一個一直存在的問題,不過沒有引起多大的注意。有了計算器,還需要背乘數表嗎?還需要筆算、心算嗎?這是科技對教育一個基本的挑戰。於是有一個問題,人類懂得計算的起點,是筆算、心算,還是點按計算器?那為什麼日本許多小學還要學珠算(算盤)?

直至1970年代,香港會考(DSE的前身)有計算需要的科目,考試局提供《對數表》(也許很多讀者從未聽說過);高班可以用計算尺。後來有了計算器,更有可以進行複雜計算的Texas Instrument。幾經周折安排,考生只能攜帶有製造商註明香港特許的計算器。科技的發明,那時候已經對考試造成威脅。

進一步說,學習數學就是為了懂得計算嗎?人們經常掛在口邊的,Literacy and Numeracy,就是識字與計算嗎?同理,有了語音書寫(而且可以寫不同的字體),人類還要不要學寫字?有了電子音樂,電子樂器也有記憶(君不見酒店大堂的自動鋼琴演奏),那人類還要不要學樂器?不管如何,考試要考學生的記憶,已經沒有多少意義。科技的發展,愈來愈多在取代很多基本的技能,就迫使我們要重新思考,學校裏面學生要學的基本技能,為的是什麼?

人們的心目中,從人類的智力來說,連起碼的四則都不會,可以說是一種終身的缺陷。但是數學還有更加深刻的意義,是人類探索自然界的重要基礎。學生識字,也是傳承與發展文化的必要基礎。科技的發明,可有涉及這些考慮?

第二、考訊息與知識。也就是考生需要一定的知識基礎,才能圓滿地回答考題。在科舉,是考來自前人的知識與智慧。在現代考試,其實是考驗學生是否熟悉正規課程裏面所包含的訊息與知識。筆者以前在中學教物理,起初需要考生牢記物理公式,後來試卷附上需要的公式。有了手機,就麻煩了,訊息與知識的素材,在網上唾手可得,考試考訊息與知識的素材,也意義不大。然而,為了維護考試的「尊嚴」(integrity),大多數考場乾脆就不准攜帶手機入考場。這其實已經有點怪異:習以為常的工具,到了考試反而禁用!考試與科技的矛盾,其實已經表面化。

第三、考創作及創造。目前在香港,社會科學與人文學科領域,純粹考記憶、訊息、知識的考題,已經愈來愈少。考學生的領會、發揮、創意的愈來愈多。在大學而言,愈來愈多的是「開卷考試」,或者集體創作。也就是學生不需要關在考場、在規定的時內,完成考試。

但是有了類似ChatGPT的生成式AI,就連開卷考試都受到挑戰,或者說沒有多少立足的餘地。大學之所以視之為威脅,就是因為難以作是否抄襲的判斷。「抄襲」是作弊,罪無可恕,是考試的最後底線。

有了類似ChatGPT的生成式AI,就連開卷考試都受到挑戰。(Shutterstock)
有了類似ChatGPT的生成式AI,就連開卷考試都受到挑戰。(Shutterstock)

考試概念,如何與時並進?

近日在網上聆聽了香港大學教學促進中心的一個論壇,有800多人登記參加,裏面有教師,也有學生。意見紛呈,很多元,不過主流是覺得要設法與時並進。擔心的是對學生不公平。學生的作業或者論文中,ChatGPT的參與有多少?是否誠實申明?是否可以列為作者之一(美國大學已經有明令禁止)?都是大家關心的問題,但都不可能馬上有答案。

筆者有這樣的想法,與讀者切磋:學生的作業或者論文,絕對不會是純粹代表學生一個人的作品。裏面一定有聽課得來的、文獻中搜索而得的、導師的意見、同學的交流,等等。生成式AI的存在,不過是又一種輸入。第一、直到目前,ChatGPT的產品,並沒有權威性。使用者需要自己判斷。第二、總體來說,不應以防範作弊作為出發點,作弊而感到舒服的,到底是少數。積極地信任學生,讓學生自主自為,才會得出積極的方案。

但是,從上面的討論來看,受到衝擊的不只是考試的形態,而是考試本身。大膽地說,教育制度裏面的考試,是工業社會生產流程中質量控制的性質。把考試看成是一個學習階段的終結,就會對於作弊之類的問題耿耿於懷。假如去掉控制的意念,把考試看成下一個階段的起點。面對日益發展的科技,也許就不再是消極地應付。

本文得到蕭文強與蔡熾昌幫助,謹此致謝。

原刊於《信報》,本社獲作者授權轉載。

程介明