大學排名:潮流開始轉變

儘管存在根本缺陷,大學排名現象在20年內不斷發展,成為全球高等教育中最強大的單一力量。排名已經成為一門大生意。

2024年,Richard Holmes在〈全球大學排名流行的時代即將結束〉一文中說:正如人們經常提到的,全球排名始於2003年上海交通大學發布的第一版世界大學學術排名(ARWU),其後,《美國新聞與世界報道》(U.S. News & World Report)把美國高校排名轉化成為美國高等教育的一股強大力量。各國和大學將繼續努力影響排名,並貨比三家,尋找最適合自己利益的排名。

Sharon Fonn在2024發表的〈專家稱排名不科學、不利於教育〉一文指出:大學排名幾十年前就開始了。從那時起,它們就變得無所不在、具有重要性和有效性。機構(尤其是排名靠前的機構)非常重視它們,有些人分配時間給員工來整理排名者要求的數據。大學捐助者認真對待它們、記者宣傳它們、一些家長用它們來選擇孩子升學的地方。

Sharon的結論是,首先,排名存在概念性問題。將所有機構放在一個籃子裏並提出一些有用的東西是不明智的。他的另一個結論是,排名者用的方法不明確,有些似乎無效。我們不會接受發表方法不佳的研究,但不知何故,排名者可以透過草率的方法逃脫懲罰。

虛假的敘述

任何所謂的大學世界排名都想讓你相信,對於任何兩所大學──世界上任何地方的任何兩所大學──其中一所在某種客觀意義上比另一所更好。無論這兩所大學彼此之間有多大差異,情況都會如此。

A大學(例如)位於亞洲,可能有工程學院和商學院,但既沒有醫學院也沒有農學院,而B大學(例如)位於南美洲,可能同時擁有醫學和農業學院,但既沒有工程學院,也沒有商學院。

或者一所大學可能位於大城市,在開展業務時不特別考慮其周圍的環境,而另一所大學可能是一所農村大學,盡最大努力與當地弱勢社區合作。或者一所大學可能專注於創業和衍生產品,而另一所大學則在策略上致力於響應聯合國永續發展目標。

排名活動是不會處理上述因素的,它的着重點是A大學或B大學中的一所必須明顯優於另一所。很難理解為什麼有經驗的學者會相信這種幻想。正如將蘋果與橙子進行排名,因為它們都是水果。

任何所謂的大學世界排名都想讓你相信,對於任何兩所大學──世界上任何地方的任何兩所大學──其中一所在某種客觀意義上比另一所更好。(Shutterstock)
任何所謂的大學世界排名都想讓你相信,對於任何兩所大學──世界上任何地方的任何兩所大學──其中一所在某種客觀意義上比另一所更好。(Shutterstock)

參加的誘惑

加入排名的務實論點是這樣的:排名是一個現實,無法透過願望而消失;他們有力地影響着公眾的看法和招生。因此,無論他們的概念有什麼缺陷,加入他們的排名是有吸引力的。恰巧,這種論點也非常符合學術虛榮心。

通常,那些在排名上表現出色的大學──即使只是暫時的──根本無法抗拒在公開場合吹噓自己的誘惑。

另一方面,那些表現較差的人則覺得自己不能公開反對排名,以免被指責吃不到酸葡萄。這樣一來,虛榮心隨之而來的是順從,整個追逐排名的活動就變得自我延續了。

排名的力量

儘管存在根本缺陷,但大學排名現象在20年內不斷發展,成為全球高等教育中最強大的單一力量。排名已經成為一門大生意。

進行排名的機構是私營營利公司。排名機構透過多種方式賺錢:從大學收集數據,然後將其商品化;出售廣告空間;向大學和政府銷售諮詢服務;舉辦付費會議。

例如,倫敦的一本小雜誌最初被稱為《泰晤士報高等教育增刊》,最初是出於好奇,於2000年代初開始進行排名,現在已經成為一家國際商業企業,無休止地收集數據,但利潤豐厚,其中大部分來自大學本身。

不知何故,排名者們已經將自己置於既是世界各地大學的審計員,又是顧問的有利地位。現在,我們有商業排名機構向大學提供收費的「大師班」,教授如何開展學術事務,以提高他們自己進行的排名工作。

排名的影響力不斷增強,以至於產生了全球地緣政治後果。

足夠的盲目自信

Chris Brink在2018年出版的《大學的靈魂》一書中,用整整一章的篇幅來闡述大學世界排名現象其實只是一種全球信心把戲。當時,這是少數人的意見。5年後,有證據顯示潮流正在開始轉變。這一變化應該讓那些仍然奉承商業排名的大學領導者停下來思考。

Chris指出,反對大學世界排名的方法論爭論是眾所周知的,並且已經被提出過很多次。本質上,它可以歸結為:為了編制排名,在同樣合理的替代方案之間需要做出如此多的任意選擇,以至於結果變得毫無意義。

他認為,建構大學排名並不困難。我們需要的不是任何技能,而是有足夠的盲目自信,告訴世界你在建立排名時所做的任意選擇實際上代表了現實。

研究績效有許多看似合理的指標,但是任何選擇都可能很容易造成分歧,從而產生不同的結果。(Shutterstock)
研究績效有許多看似合理的指標,但是任何選擇都可能很容易造成分歧,從而產生不同的結果。(Shutterstock)

首先,選擇要評估的活動類別。這種選擇通常是出於權宜之計,因為某些活動(如研究成果)比其他活動(如社會參與)更容易衡量。當然,評估內容的選擇亦可能出於對某些大學有利,而對另一些大學不利。

其次,必須在所選類別中選擇績效指標以及如何衡量它們。例如,研究績效有許多看似合理的指標,但是任何選擇都可能很容易造成分歧,從而產生不同的結果。此外,在選擇績效指標時,必須選擇使用觀點指標與事實指標的方式和程度。觀點指標包括聲譽就只是一個意見問題,學生滿意度也是一個意見問題。

第三,建基於許多選擇而得出的每個績效指標數字,仍然需要套入一個選擇好的數字公式,方能得出大學排名。例如,平均值可以是平均值或中位數;每個績效指標分配權重亦可以透過無數種方式來完成。將一組數字組合成一個數字的方法有很多種,但無論是數學上或經驗上,都沒有強而有力的理由來選擇其中一種方法。

因此,任何大學排名都至少反映了排名者所做的選擇,因為它可能反映了這些大學的任何現實。很難擺脫這樣的懷疑:排名者根據自己對「最好」大學的先入為主的觀念來做出選擇。如果排名不符合他們的先入之見,他們會改變他們的參數,而不是調整他們的先入為主的看法。

Chris最後指出:這意味着排名是規範的,而不是描述性的。它們創造的現實至少與它們反映的現實一樣多。

積極跡象

與最初的評級相比,最終產生的排名存在嚴重的資訊遺失──那麼這樣做有什麼意義呢?為什麼不簡單地保留多維性,並按原樣呈現評級結果,而不是隨意將其壓縮為單一數字?

幸運的是,有令人鼓舞的跡象表明潮流正在開始轉變。

變化的標誌之一是人們愈來愈意識到,除了簡單的一維排名之外,還有可行的多維替代方案。它們通常是透過區分一組評級和排名而產生的。

黃顯華