善用網上學生評估 TSA與SA各有功能

香港的多層次系統評估,能夠幫助教育當局了解各個重要學習階段的基本水平,又可以與國際水平作比較、參照,可說是非常完備。

全港性系統評估(TSA)重生了!雖然新TSA的說話評估等部分已於本年5月二、三日順利完成,但它依然成為立法會內外備受爭議的焦點。近日,教育界進一步要求教育局制訂明確的監察計劃,避免衍生不必要的操練及教學異化等現象。究竟TSA的變革是成功還是失敗呢?未來調整的方向又在哪裏呢?

回想於2015年一個有關TSA的論壇上,朗朗響起一群家長在1999年的宣言:「……孩子有愉快的學校生活,每天從學校帶回家的,不是眼淚、沉重的功課和大量要溫習的測驗……」這個宣言表達了家長們對檢討和監察異化後的TSA的訴求。在家長和教育團體的努力和堅持下,小三的全面評核終於能夠在2016-2017學年稍停片刻,改而進行了所謂「優化TSA」的研究試驗計劃,該計劃以基本能力評估(BCA)為名。2018年3月教育局公布TSA全面復考,但這次是「不記名、不記校、每校抽樣10%學生,而且不設學校報告」。這樣的安排與以往筆者負責的PISA國際評估相似,由於每校參與人數十分少,亦不能代表學校整體的小三表現,加上教育局指明不再向考評局索取個別學校的成績以作識別,這樣的安排可算是一大進步,回復當初以TSA作為系統評估的原貌。

全港性系統評估(TSA)與學生評估(SA)的分別

抽樣模式的TSA結果只能反映全港小三年級的整體水平,不能反映個別學校小三年級的教學成效,對學校參考價值有限。其實,原先香港真正的基本能力評估(BCA),除了全港性系統評估(TSA)以外,亦包括久被忽略了的學生評估(SA)。扭曲了的TSA成為眾矢之的後,討論焦點停留在TSA的存廢及改良上,而忘記了更能發揮「促進學習」、具有「即時回饋」作用的SA。

現時的SA建基於網上學生評估平台(現稱STAR),這個支援「學」與「教」的網上評估系統,包涵了評估試題庫、電腦自動評卷及學生表現報告。老師可因應教學的特定範疇,在試題庫中選取適合的試題來設計測驗卷,然後安排學生在課內或課後完成測試,最後交由電腦自動評卷。相比TSA這個學年6月考,須待下一個學年才收到報告,SA可以為教師在更短時間內提供反饋。採用SA後,老師可因應某些題目的答對率來評估試題的難度,或因應學生的整體答對率來評估個別學生的表現,從而了解學生的強弱,以及分析個別題目的主要誤解(misconception)。由此可見,SA/STAR能更有效率地回饋老師、改進教學,實在值得推廣,讓更多教師接受有關培訓,以掌握並充分使用它,進而發揮「促進學習」的原意。

如何令小三的評估數據更有參考價值

其實TSA及SA各有功用,教育當局應徹底執行「抽樣式」的TSA作系統評估,並鼓勵小學老師充分使用SA/STAR這個電腦化評估,才能得到更有參考價值而實時回饋教與學的資料。有關先進的評估方法,我們可以參考一下愛沙尼亞這個發明Skype的國家。愛沙尼亞於2011-2012年開始將部分學科考試逐漸變成電腦化評估,其評估不限於多項選擇題(Multiple choice),亦包含開放式題目(Open-ended),可見電腦化評估日益普遍。而香港的網上學生評估平台(SA/STAR)其實正是電腦化評估的先驅。改良SA/STAR有助教師設計教學及了解學生水平,SA更可朝着電腦化適性測驗(computer adaptive test, CAT)的方向改良。所謂「適性測驗」是在試題設定上,根據考生的答題正誤,調整下一題的難易度,在試題庫中選出最適合該學生的試題,因此考生不用解答超出或低於能力、太難或太易的試題。傳統的測驗一般讓全體考生考同一張試卷,但「適性測驗」可考慮考生的個別差異,考試不會用過難的試題打擊學生士氣,或用過易的試題消耗考生時間和精力。

總結

其實香港的多層次系統評估,能夠幫助教育當局了解各個重要學習階段的基本水平,又可以與國際水平作比較、參照,可說是非常完備。只要我們毋忘設置這些評估的初衷,再三提醒公眾及當局「不要再誤用或濫用評估數據」,繼續相信與家長同行的力量,今天我們成功爭取TSA「改為抽樣、不記名、不記校」,明天定能維繫更臻元善的香港系統評估。

註1:〈一群家長的宣言:我們對香港教育的願望〉。1999年2月9日,《明報》廣告。

註2:政府新聞網(2018年3月16日)。〈TSA不記名不記校抽樣進行〉

何瑞珠