教大學者醉心粵語研究 以懷舊電影創建網上語料庫

近年香港開始興起保育粵語的運動,要追根尋源,就應先了解粵語過去到現在的面貌及其演變。

 

任何語言都會隨着時代演變,香港的粵語也不例外。今天年青人用「堅」來代表「十分」的意思,例如食物好苦會說「堅苦!」,但上一輩可能會用「好鬼(死)苦!」或「苦到死!」等;60年代的香港人偶然還會說「我送本書過你」,現在大多只說「我送本書畀你」。近年香港開始興起保育粵語的運動,要追根尋源,就應先了解粵語過去到現在的面貌及其演變。

香港教育大學(教大)語言學及現代語言系副教授、語言學及語言研究中心副總監兼人文學院副院長(研究及研究課程)錢志安博士及其研究小組,於2013年獲得研究資助局的傑出青年學者計劃撥款,開展題為「20世紀中葉香港粵語的語料庫建構及研究」的研究項目,探索粵語在過去半世紀的發展。

錢博士對粵語的興趣濃厚,一直致力從事有關研究。他曾獲尤德爵士紀念基金海外研究生獎學金,負笈美國華盛頓大學攻讀博士課程。2009年憑博士論文中粵語「畀」字句的語法演變研究,奪得國際中國語言學學會第十七屆學術年會青年學者獎。2012/13年,錢博士獲教大(前教院)授予傑出研究表現校長獎項中的青年學者卓越研究獎。錢博士曾獲香港電台邀請,在《晨光第一線》節目中跟聽眾分享語言、社會和文化之間的有趣現象。

錢博士2011年獲教大研究撥款,以一年時間,把20套粵語長片的劇本對白謄寫下來,設立首個「香港二十世紀中期粵語語料庫」。通過這個語料庫,研究團隊可以對20世紀中葉香港粵語進行不同層面的分析。
錢博士2011年獲教大研究撥款,以一年時間,把20套粵語長片的劇本對白謄寫下來,設立首個「香港二十世紀中期粵語語料庫」。通過這個語料庫,研究團隊可以對20世紀中葉香港粵語進行不同層面的分析。

以粵語長片對白為語料 重現半世紀前香港粵語的面貌

錢博士分析19至20世紀初粵語文獻資料時,發現粵語在過去百多年有不少轉變,這些觀察促使他構思建立20世紀中葉香港粵語語料庫的研究項目。當中最大挑戰是尋找當時的真實語言材料來分析。與長者進行訪談可以是探討早年用詞遣字的其中一個方法,但礙於長者未必記得,且受年輕一代的語言習慣影響,他們現在運用的語言不一定可以如實反映早年的實際情況。錢博士亦曾嘗試聯絡兩大電台以取得早年廣播節目的聲帶作研究,奈何當年以磁帶儲存的聲音檔案大部份已無法重聽。

要解決困局,錢博士想起自小觀看的粵語長片。五、六十年代是粵語長片的全盛時期,二十年間便生產了約3,000部電影。戲中許多場景非常寫實,這些電影把當時的流行用語及語言習慣等聲畫俱備地記錄下來,正好是研究早期粵語難得的素材。

錢博士指新版本的語料庫把電影片段與相關對白配對,用戶可以生動傳神地了解對白的意境,說話人的神態等。圖片中的電影為《標準丈夫》(1965)。
錢博士指新版本的語料庫把電影片段與相關對白配對,用戶可以生動傳神地了解對白的意境,說話人的神態等。圖片中的電影為《標準丈夫》(1965)。

獲研資局撥款資助 擴大語料庫涵蓋範圍

錢博士2011年獲教大研究撥款,以一年時間,把20套粵語長片的劇本對白謄寫下來,設立首個「香港二十世紀中期粵語語料庫」。通過這個語料庫,研究團隊可以對20世紀中葉香港粵語進行不同層面的分析。此外,語料庫內容可在網上搜索,只要輸入「唔該」一詞就可以搜尋到出現過這個詞語的電影,哪位演員曾經說過等。錢博士把語料庫開放予公眾人士免費使用,讓更多志趣相投的學者運用語料庫資料從事粵語及相關學科研究,達致知識轉移的目標。至2017年初,語料庫有千多位來自世界各地的註冊用戶。此外,錢博士曾獲得教大人文學院技術轉移基金(2014/15)及語言學及現代語言系技術轉移基金(2014/15)資助,構建「粵語數碼博物館」,展示一些半世紀前香港粵語較有特色的詞匯、語法等現象。有些是跟社會文化有很大關係但已逐漸消失的詞語,如「令尊(翁)、令千金、三少奶」等稱謂語。

2013年,錢博士獲得研究資助局的傑出青年學者計劃資助,擴大語料庫的內容,涵蓋由1947年至1970年製作的60套粵語長片,影片種類包括劇情片、喜劇及偵探懸疑片等。即將推出第二版的語料庫收錄了約180位男演員及140位女演員的對白,約76萬字及12萬語句。除了謄寫的對白之外,新版本的語料庫並把電影片段與相關對白配對,用戶可以生動傳神地了解對白的意境,說話人的神態等。除了漢字,語料庫也可以用粵語拼音檢索,例如只要輸入拼音「bei2」就可以搜尋到「畀」、「彼」及「比」等同音字詞,方便不熟悉漢字的用戶。

錢博士希望這個語料庫不只增加我們對粵語演變的理解,同時也可以更深入了解語言的運用。比如說,同一個句子,如「唔該晒」,可以有不同的演譯方法,通過影片中演員說話時的語調、肢體動作、眼神及面部表情等,可以開展多模(multimodal)的語言研究。

錢博士獲得教大人文學院及語言學及現代語言系技術轉移基金資助,構建《粵語數碼博物館》,展示一些半世紀前香港粵語較有特色的詞匯、語法等現象。有些是跟社會文化有很大關係但已逐漸消失的詞語,如「令尊(翁)、令千金、三少奶」等稱謂語。
錢博士獲得教大人文學院及語言學及現代語言系技術轉移基金資助,構建《粵語數碼博物館》,展示一些半世紀前香港粵語較有特色的詞匯、語法等現象。有些是跟社會文化有很大關係但已逐漸消失的詞語,如「令尊(翁)、令千金、三少奶」等稱謂語。

語言學及語言研究中心 以語料庫數據發展教材及教學資源

錢博士認為語料庫數據有助發展網上語言學習教材。他舉例說,粵語長片能提供一個生動的語境,當中有很多都是日常用語,可以讓學習者較易明白和掌握粵語有關詞句的運用。錢博士舉例,曾有學習粵語的學生因只懂說「多謝」一詞而鬧出笑話,因為這位學生經常着別人幫忙買飯盒,之後只說「多謝」,讓人誤會他不想付錢。粵語長片中有不少這些交際用語,可以用來編寫教材。

研究成果講求知識轉移及實踐應用,錢博士指出語言學及現代語言系和剛成立的語言學及語言研究中心正好配合這方面的發展。中心及學系除了積極推廣語料庫的發展及應用外,亦從事跟粵語有關的研究,如語言學習及語言與社會的關係。前者有中心總監及語言學及現代語言系系主任張顯達教授的《香港南亞裔學童的敘事能力發展》研究項目,探討粵語口語能力對中文讀寫發展的貢獻,所得結果有助於南亞裔中文教育的規劃及推行。後者有語言學及現代語言系副教授王立勛博士的《香港小學的三語教育研究:英文,廣東話和普通話作為不同科目的教學語言將對語言學習產生怎樣的深遠影響》研究項目。此外,語言學及現代語言系過去幾年為特殊教育與輔導學系言語治療碩士課程提供語言學的培訓,包括粵語語法、語音及語言發展等範疇,加強學生的本科知識,並達至跨學科研究的協同效應。

(圖片:香港教育大學)

 

本社編輯部