基本能力有爭議?
考評局每年全港性系統評估報告的前言都開宗明義表明, TSA 是評估中、英、數三科的基本能力。很顯然,評估應該是以標準參照(criteria reference)為原則,這也是普及教育量度是否大部分人達到教育目標的評估原則,理應與區隔學生能力高低的常模參照(norm reference)評估有所不同。然而,近期竟仍有必須擬定更深 TSA 評估題目的主張,不贊成 TSA 題目局限於基本能力範圍。教育局是否連對 TSA 作為「基本能力」評估工具的取向都仍不敢肯定?如對這個基本立場都仍搖擺不定,則無怪乎出現近年學界及家長都關注 TSA 題目愈來愈深的現象。
TSA 水平釐定方法的盲點
為了設定不因每年學生「能力」差異而改變的統一「標準」,TSA評估報告指出,是以兩個方法進行水平釐定,其一是以安戈夫方法(Angoff):「每名專家小組的成員憑著個人的專業判斷,估量一個剛剛達到基本能力水平的學生在各試題的答對率,然後匯集各人的結果,再調整修訂,以求達到共識,計算出學生應得分數。」其二是虛擬書籤(Bookmark):「每名專家小組成員以虛擬書籤來標記達到與不達到基本能力水平的學生樣本表現,之後剔除那些異常嚴格與過分寬鬆的判斷結果,定出書籤的最終位置以表示水平。」
如這兩個過程不是每年進行,試題一旦出現基本水平加深的現象就沒法監察。即使真的每年進行此水平釐定方法,「專家小組成員憑著的個人專業判斷」,會否因為整體學生的基本能力(可能只是操練得來的答題技巧)日漸提升而水漲船高,不知不覺地提升了對學生基本能力的要求,而導致題目愈來愈深?這可能是 TSA 一個極大的評估盲點!
報告又提到:「為使香港的水平能與其他國家互相比較,兩種水平釐定方法得出的結果還需參考國際水平以訂定最終的達標分數。」我們在這裏提出一個疑問,翻查過去各項學生能力國際比較研究結果顯示:自2006年起至今,PISA、PIRLS 及 TIMSS 各次閱讀及數學能力排名,香港學生都穩守前1—4名,顯示香港學生的整體能力水平處在高位, TSA 如何「參考國際水平訂定最終的達標分數」?會否因應香港學生的高能力水平而向上提高?抑或以香港學生已處於國際高位,而應調低至符合國際間的合理水平?教育局值得對此給予一個合理的回應。
「水平維持模式」的誤用——TSA 試題日漸加深的背後原因
根據 TSA 評估報告載列,考評局是想用以下「水平釐定與維持」模式讓每年的基本能力水平維持不變:「於第一年進行全港性系統評估前,以分層抽樣形式,選取適量的樣本學生參與研究測驗,這批學生須同時參與該年的全港性系統評估。第二年,也有同樣數目的樣本學生參與相同的研究測驗和該年的全港性系統評估。第一年的全港性系統評估題目會和研究測驗的題目合併計算難度值。同樣地,相同的研究測驗題目會和第二年全港性系統評估題目合併計算難度值。透過假設研究測驗題目的難度值相若,不同年份的全港性系統評估題目的難度值便可校準至同一尺度。換言之,不同年份的學生表現便可在同一尺度上作比較。」
以上的「水平維持模式」存在一個很大的漏洞,亦正是整個系統評估由「基本能力評估」,走至11年後的今天,超離了「基本能力」,試題愈出愈深的核心原因。這機制的確可以使「不同年份的全港性系統評估題目的難度值校準至同一尺度」,但難度值的計算方法應是以該年度學生的答題表現來計算。這機制的確有效維持每一年試題的「難度值相若」。這正忽略了學校想努力提升學生答題中的表現,而年復一年不斷進行學與教的改進 (正面方法),甚而進行大量操練(負面方法),令學生答題表現愈來愈好,更多學生逐漸適應在短時間應答更深題目的能力。
這個既定的「水平維持模式」要努力去維繫一個每年相約的「難度值」(題目答對率),以符合「能力」愈來愈高的學生,唯一方法就是逐步加深試題。這是十年來前線老師都親身經歷到、也有不少 TSA 試題分析論文指出的表象,但背後的原因卻的確出人意表!
身心健康才是爭成績的本錢
無論家長、學校及教育局都要充分明白,一個香港教育經常出現的誤區:用評估工具扭曲教育改革的原意。這所以歷史就像一個魔咒,讓升中試、學能測驗,以至今天的 TSA 都要走上必然異化之路的原因。
筆者之一近年在校內做了兩個小型研究,了解最佳成績學生及最大進步生的學習方法。結果發現他們都是快樂的小天使,都有相近的學習方法與環境:父母以安慰而非責難的方法處理學習挫敗;參與各項活動令自己身心平衡;努力掌握各種自學方法。更令人警醒的是,他們大都不會操練試題,每天用最短時間完成功課,騰出更多時間閱讀。他們學習的取勝之道就是從學習能力的基礎入手,而非練習應試技巧。
只要我們所有成年人肯退一步為孩子設想,不要斤斤計較他們在早期的學習階段就要有絕佳的紙筆測試表現;讓他們有足夠空間自由自在倘佯書海之中;在學校擁有更多、更深刻的學習經歷;在家裏、在閒暇享受這世界的美好一面。我們的確可以看到,15年前的教育改革願景:「學會學習,樂於學習」,不會只是一紙空文,這端賴我們可以主宰或影響教育的每一個成年人能否放下成見,回到基本而已。
如果我們都願意虛心探討及反思 TSA 評估工具出問題的原因,重新思考評估的目的及本質,今日的紛爭未嘗不可以是一響警鐘,讓我們對孩子的未來再作一次深刻的反思。
原刊於2015年12月22日《星島日報》教育版,獲作者及《星島日報》授權轉載。
(封面圖片:Pixabay)
!doctype>