大型國際評鑑(一):回顧及反思

愈來愈多國家開展各類型的大型評鑑。基本目標是評鑑教育系統及課程與教學,以便制定能夠提高教育質量和促進教師專業化發展的政策。
筆者嘗試撰寫「大型國際評鑑」一系列文章,分析大型評鑑對教育政策及教學實務的啟示。部分內容源自筆者於2012-2015年為 UNESCO 撰寫的亞太地區教育綜述(第5卷)《學生學業評價》(Student Learning Assessment),並根據當前香港在評鑑上的爭議作進一步的反思,期望有助教育界以國際視域更全面地檢討未來的各類評估,並提供更充分的理據及數據作為討論及檢視的基礎。
 
這一系列文章首先簡介在21世紀的技術與知識型社會中,國際評鑑上如何界定學生應該掌握哪些技能和核心能力。第二,介紹不同國家及地區現行的各種大型評鑑體系。第三,分析國際評鑑的性質與影響,從而剖析這些評鑑的目的、性質、當前影響與今後可能的影響及挑戰。最後,討論評鑑體系在亞太區的發展趨勢,各種大型國際評鑑體系的經驗,各國在建立評鑑體系的重大挑戰,以及部分國家如何將評鑑資訊應用到教育政策的制定及教學實務的改善。
 

多維度的評鑑

 
自60年代起,大型國際評鑑在國際間愈來愈普遍,全球發達國家以及發展中國家,對學生學業成果的興趣皆與日俱增。評鑑的主要目的在比較不同國家的教育水平及分析達至該水平的可能因素。這些國際評鑑,有助了解學生學業成就和學校效能,以及不同教育系统的素質。
 
整體而言,評鑑(assessment)一般是多維度的,各種評鑑架構亦千差萬別,但其功能亦有相似之處。這種多維評鑑可以是大型的國際評鑑(international assessment)、國家評鑑(national assessment)或區域評鑑(regional assessment),也可以是公開考試(public examination)、校內考試(school based assessment/examination)甚至班級內考評;可以標準化(standardized)也可以不標準化(Clarke, 2011)。很多國家都有自己的評鑑系統,大型國際評鑑則有助通過跨國層面收集學生學習成果資料,開發學校效能的國際指標體系,並據此進行國際比較對照或標準參照(benchmark),從而以實證為本(evidence based)制定教育決策或干預措施,以改善教學實務,繼而提高教育系統的成效。
 

評鑑指標的建立

 
在大型的國際評鑑中,面臨的首要挑戰之一是建立評鑑指標體系,用於界定學生各種技能和核心能力能否適應新技術及知識型社會乃至在國際市場的需要,以應付全球化下的競爭。在這個評鑑指標下,評鑑不僅能夠監測「認知」方面的學業表現,也包括「非認知」方面的技能與能力,並能以國際標準作為參照。日本學者亦是 PISA 前管理委員會主席 Watanabe(2010)指出:「21世紀的人應該具備足夠的技能,讓他/她能像管弦樂演奏者一樣合作(collaborators and orchestrators)、像樂曲合成者一樣統籌(synthesizers)、像解說家一樣領悟(explainers)、像藝術家(versatilists)一樣多才多藝、像交際家一樣靈活(personalisers)、像導航定位儀一樣精準(localisers)。」可見評鑑的內涵愈來愈廣泛。
 

學生關鍵能力

 
評鑑學業成就及教育成效、鑒別面對瞬息萬變的世界時所需的關鍵知識與技能,已經不是新近的議題。國際間在通過界定學生技能和核心能力來評鑑教育質量上,已作出很多的努力和嘗試。經濟合作與發展組織(The Organization for Economic Co-operation and Development, OECD)的項目 DeSeCo(Definition and Selection of Competencies)以及ATC21S(Assessment and Teaching of 21st Century Skills)都曾探索這個議題。這兩個國際評鑑專案旨在回答如下幾個問題:(1)國際公民需要具備哪些知識和技能;(2)如何教授這些知識和技能;(3)如何測量和評鑑學習成效(ATC21S, 2009; DeSeCo, 2003)。
 
經濟合作與發展組織的專案 DeSeCo(Definition and Selection of Competencies, 2003)為學生能力國際評估計劃(Programme for International Student Assessment, PISA)有關核心能力評鑑體系的發展提供了框架。DeSeCo(2003)將能力大致劃分為三大類:
 
工具應用能力:我們應該懂得靈活運用廣泛類型的工具與環境之間有效互動,並諳熟各類工具的功能並為我所用。
 
人際交往能力:在這個日益緊密聯繫的世界,我們會遇到各種背景的人。因此,學會和不同群體打交道是很重要的。
 
自主行動能力:我們應該懂得為自己的生活負責,讓自己生活在更廣闊的社會脈絡並擁有自主的行動。
 

21世紀的核心技能

 
最近 ATC21S 試圖為21世紀技能訂立一個清晰而可應用的定義,並識別出10項必備技能,分為四大類:
 
思維方式:一、創新和創造力;二、批判思維、解難能力和決策能力;三、學會學習、元認知(對認知過程的認知)。
 
工作方式:四、溝通能力;五、團隊合作能力。
 
工具應用:六、信息素養;七、資訊和通訊技術素養。
 
生活方式:八、公民意識,包括全球的和本地的;九、生活和職業;十、個人和社會責任,包括文化意識和能力。
 
知識型經濟社會所需的技能和核心能力,超越了傳統學術學習範圍。特別是基礎教育,我們的目標不僅是提高基本能力,更追求這些基本能力的分配機會,達到公平和優質(Equality and Quality)的目標(G.-J. Kim, 2010)。要達到公平和優質兩個主要目標,課程設置、教學方式和學業及非學業成果評估等方面都要互相契合。
 
實際上,愈來愈多的國家開始積極在正規教育及非正規教育系統中,對所有學習者開展各類型的大型評鑑。它們的基本目標是評鑑教育系統及課程與教學,以便制定能夠提高教育質量和促進教師專業化發展的政策。在亞太地區,如中國香港、日本、韓國、新西蘭、中國上海、新加坡等經濟發達的國家,有成熟穩定和結構嚴謹的評鑑體系;而在像柬埔寨、越南、馬來西亞、印尼、不丹、蒙古、巴基斯坦和菲律賓等國家,評鑑體系建設還處在起步階段,但他們的發展並不是落後,而是具有自身的特色。
 
以不丹為例,自從前不丹國王於1972年首度提出國民幸福總值(Gross National Happiness, GNH),這個概念至今對評估社會發展仍然深具啟發意義。尤其應用在教育文化生活上,以國民幸福總值為目標,取代利用教育作為提高生產力的工具,重現學生心靈上的和平、快樂及幸福感的自足價值,這些都特別值得華人社會借鑑。 
 
(封面圖片:Pixabay / CC0)

何瑞珠