想過嗎:分數是什麼?

對於講究分數的測評慣性,固然難以逆流而上。但是在順從之餘,完全可以在分數以外,在其他方面努力尋求突破。香港學校的創新,不少都在這個方向。

上周提到香港的語文教學,往往因為可控不可控、可測不可測,而決定學生作業與考試的內容與模式。這裏面有兩個深層的問題:一、如何知道學生學得怎麼樣?二、如何分辨學生學習表現的優次?前者是教育的教學專業問題,後者則涉及教育的社會功能問題。

大概是5、6年前開始,美國大學報考的學生可以不呈報例如SAT或者ACT成績,而且領先的都是名牌大學。筆者非常感興趣,因為這表示大學入學不一定看成績。考試成績──也就是分數──這個入學門檻,是一個瓶頸。只是看到學生狹窄的一種能力,看不到學生全面的潛能,其一。也對中學造成了莫大的負面壓力,其二。因此對於這個動向,寄予厚望,希望從中獲得一些突破性的模式與思維。

不看考試成績,當然有許多替代的辦法。例如香港的大學入學,也用口試,也可以是集體口試;但大都是在競爭激烈的學科才可行,因而往往是在按成績篩選以後的第二次選拔,並非不看成績。例如美國的大學,以往也會看學生的Essay,等於是學生的自述,用來了解學生的志願、心態、經歷等等;但都是在看了成績以後的附加。再看這次美國有些大學不看公開考試成績,就轉看校內成績,比如看一名學生的成績,佔全班或者全級的領先百分比,其實是不科學地繞過了學校差異,然而成績仍然是一個核心。這些都不會帶來什麼新思維。

美國近年改寫歷史,把黑人放在美國歷史的中心舞台,於是種族問題馬上成為教育討論的核心議題。(Shutterstock)
美國近年改寫歷史,把黑人放在美國歷史的中心舞台,於是種族問題馬上成為教育討論的核心議題。(Shutterstock)

大學收生不看考試成績,為什麼?

再了解一下,卻有點失望。原來這項收生政策的變化,背後驅動的不是什麼教育的理念,而是意識形態的考慮,是由於一種意識:純粹用分數作篩選指標,對於一些不適應測驗的學生,不公平。潛台詞是測驗成績,不利於某些種族,尤其主要指黑人。這可以說是否定了「分數最公平」的觀念。

美國近年改寫歷史,把黑人放在美國歷史的中心舞台,於是種族問題馬上成為教育討論的核心議題。很多大學,都要教師簽一個DEI聲明,保證不會違反三個方面:diversity(多元)、equity(公平)、inclusiveness(融合),簡單來說,以保證弱勢種族或者弱勢社群不會受到歧視。在這種社會意識影響下,成績和分數就成了種族問題的一個焦點。一直以來,有些大學的收生,已經悄悄設下了種族限額,不看成績不過是進一步。

2014年,一個一般認為是極右的民間組織,入稟控告哈佛的入學政策,提出的命題剛好相反:很多亞裔學生,成績高但是不獲錄取;認為是對亞裔學生的歧視。也就是說,控方認為按分數收生是最客觀的。哈佛辯稱測驗成績並非收生的唯一考慮,校園中有各類種族的融合,也是教育的重要因素;因此需要設下一些種族限額,平衡各類種族的收生。2019年,麻省地方法院判定哈佛並無歧視亞裔學生。但是後來美國最高法院決定接受上訴,並於2023年6月判決哈佛違法。哈佛校長認為,若按照判決,學生將不再能夠在多元化的校園中學習和生活。其潛台詞就是:校園將會充滿成績高的亞裔學生。他認為不能單純靠成績收生,同樣也是否定了「分數最公平」的觀念。

中國語文學習,學生答題取得分數,竟比知道學生的語文能力還重要。(Shutterstock)
中國語文學習,學生答題取得分數,竟比知道學生的語文能力還重要。(Shutterstock)

分數是評量學習的客觀標尺嗎?

上面美國的兩個例子,焦點都在分數。前者認為黑人學生因為分數低不能入學而不公平,後者認為亞裔學生分數雖高不能入學而不公平。看來是客觀的分數,卻可以有幾乎相反的主觀判斷。前者會認為亞裔學生太多,後者則認為亞裔學生太少。分數就真的是一種客觀的標尺嗎?

這背後有幾個問題。第一、成績或者數字是最客觀和最可靠的嗎?分數與數字,吸引人的地方,是它們的精確性。但是,分數的背後,是它們在考什麼?在英國和美國,都有傑出的學者,論述非主流族裔由於文化的差異、語言表達的隱性特點、家庭對教育的不同觀念,而使得學生在教育體系裏面吃虧。也就是說,同樣的考試,對於有些學生,設計上就是對他們不公平。反過來說,「分數最公平」其實是一種謬誤。

在華人社會,也包括日、韓、越這些「筷子文化」的社會,由於古代科舉的影響,對於考試情有獨鍾。科舉的特點,就是相信考試是唯一公平的選拔方法,而考的只是經史子集、文字功夫;人們並不計較考的是什麼。到了工業社會,考試又成了社會分層分類的絕佳工具。也的確,在現代的華人社會,考試的嚴謹程度、人們對考試的信任程度,其他社會難以比擬。這也就導致上周的討論,中國語文學習,學生答題取得分數,比知道學生的語文能力更加重要。久而久之,能考、能給分,就當作知道了學生的語文能力。

學生的學習,有許多方面是無法用數字表達的。(Shutterstock)
學生的學習,有許多方面是無法用數字表達的。(Shutterstock)

分數以外,還可以如何評量學生的學習?

第二、只相信分數,有什麼不好?注意力偏重在分數,也就是偏重在可以數量化的東西上面,可以引起非常惡劣的結果。美國有些州把教師的業績與學生的表現(包括成績、成績增值、輟學率、犯事紀錄等)掛鈎。一位在弱勢社區任教的名教師,就因為學生的成績增值不到位,被免職。一個學區,為了應付指標,學區主任串同全區的校長,集體造假。令人嘆息:假如要求的就是達標,大家就想盡辦法去達標。偏重了數字,就丟棄了更重要的東西──學生的全面發展、教師的專業素質等。教師和學校的注意力,就從學生的福祉轉移到本身的職業得失。

有這種情形:當出現一種新的學習內容或者教學法,往往就有人問:如何測量,意思是如何弄成數字。更聽過一位世界銀行請來的教育測量專家開宗明義就說:「沒有測量,就沒有學習」。敢說,這也許是另類的愚昧,還儼然是權威。掌握了每一名學生的所有數字,並不等於就了解了這名學生;更何況只是某種狹窄測評的數字。這大概是每一位教師都可以領會到的。

因此,就中國語文的學習而言,由於小學還要「交分」,中學最後還要考DSE,對語文分數的重視,就不是個別教師的事,而變成了整個行業的行事習慣。而且,只要我們細心觀察,「可考」知識的積累代替能力的培養,其實不止於中國語文。最容易說明的,數學:學會計算,並不等於學了數學。

第三、不用數字,也可以「評量」嗎?學生的學習,有許多方面是無法用數字表達的。但是要質性地評估,也有很多辦法。一、我們能夠量化測量的,大都是總結性的結果,不容易看到過程。但是今天,利用科技可以記錄學生逐步進展的過程,過程就比結果更重要。二、我們習慣了的測評,一般是想了解學生「懂得什麼」,也就是「知識」;而不是他們「能做什麼」。現在不少學生的作業,需要製作或者創作。學生各出其謀,就不會有「標準」答案。三、傳統的評估,測量的都是一個個孤立的點,看不到學生的綜合能力。四、一般的測評,只看學生個人的努力,學生互動可以被看成是作弊;現在可以把學生的作業全部放上網,鼓勵互相評論;學生的注意力就不再是分數。這些評估的過程,也許包含大量的主觀因素,其實不必迴避,也並不罪過。需要研究的,不是測評的手段,而是需要重新定義「測評」,用新的眼光看待「分數」。

以上種種,是筆者肺腑之言。但是,筆者認為,對於講究分數的測評慣性,固然難以逆流而上。但是在順從之餘,完全可以在分數以外,在其他方面努力尋求突破。香港學校的創新,不少都在這個方向。

原刊於《信報》,本社獲作者授權轉載。

程介明