粵語「輸入方法」趣談

粵語是我國最早「對外開放」的漢語。在不同背景和適用性之下由各漢語言學家開發出來的粵語拼音標準,點算起來不下十個。

編按:馬崑崙為黃樹堅老師的學生。

港人學粵語不用拼音,因為自恃由細浸到大,不用特別去學。內地人或外國人學粵語喜歡用拼音,因為講得又打得(打,即打字,輸入也)。用音標來學習語言是近百年的新興做法,而粵語是我國最早「對外開放」的漢語。在不同背景和適用性之下由各漢語言學家開發出來的粵語拼音標準,點算起來不下十個。

壟斷手機操作系統半壁江山的谷歌(Google),近年為粵語人士開發了手機「粵語輸入法」(註1)。除提供「語音辨識」、「手寫」、「筆劃」三種輸入方式之外,也提供三種粵語拼音輸入法選擇,以方便熟悉粵語拼音使用者於手機輸入漢字。它們分別是:「耶魯」、「粵拼」、「教院」;預設的選項是「耶魯」。谷歌首選「耶魯」,主要是其在海外教授及學習粵語的群體中最為通行。「教院」標準可視作香港政府上一代打造的標準,由教育署開發,本港資深語文科老師多有學習。回歸後香港政府改為推廣由「香港語言學學會」開發的粵語拼音標準,簡稱「粵拼」。香港政府於2004年發表官方粵音字庫《電腦用漢字粵語拼音表》,收錄漢字超過29000個,用的拼音標準就是「粵拼」。

「電腦用漢字」當時除了要處理輸入及發音辨識的問題之外,還要處理電腦字符(文字及符號)儲存內碼(language encoding)的問題。早期電腦字符內碼主要是美國的ANSI標準,只照顧歐美為主的字符。所以當時中文電腦要另創自己的內碼,例如台灣的大五碼(Big5)或内地的國標碼(GB)。衍生的問題是:支援大五碼的中文系统開啟用國標碼的中文文件見到的就是一片亂碼文字;另外繁體及簡體字同文出現的情况基本上絕無僅有,因為兩套內碼不能合用。

其後,網絡世界同心解決這個問題,建立一致的標準Unicode。Unicode的漢字標準收錄的,包括有繁體、簡體、日韓漢字、甚至很多古漢字。現在不論是電腦或是手機的操作系統,用的都是Unicode標準。Unicode的粵音標注,用的也是「粵拼」。可以說「粵拼」把「粵語輸入」、「電腦字符內存及顯示」的兩方面都接通,地位超然。

谷歌 (Google)手機「粵語輸入法」提供三種粵語拼音輸入法選擇:「耶魯」、「粵拼」、「教院」;預設的選項是「耶魯」。
谷歌 (Google)手機「粵語輸入法」提供三種粵語拼音輸入法選擇:「耶魯」、「粵拼」、「教院」;預設的選項是「耶魯」。

Unicode粵音標注造成新問題

然而,新的標準解決了老問題,同時又造成與過去不銜接的新問題。香港中文大學編製《粵語審音配詞字庫》時考慮到這一方面的需要,支援「粤拼」、「耶魯」標準的查詢以外,還加上支援國內的「廣州」(廣州話拼音標準),和另外三個重要的粵語拼音標準:「黃錫凌」、「國際音標」、「劉錫祥」。其中「黃錫凌」的重要性,在於連接數碼時代以前的大量粵語標注著作。此話怎說?作為開發《粵語審音配詞字庫》參照基礎之一的《粵音韻彙》就是「黃錫凌」本人的著作,用的就是「黃錫凌」標準。不少現時仍然通行的粵音字典,如喬硯農的《中文字典》、中華書局的《中華新字典》、商務印書館的《商務新字典》等,採用的也是「黃錫凌」標準。順帶一提,下文解說時所用的拼音,亦是「黃錫凌」標準。《粵語審音配詞字庫》加入了這幾個標準的支援,使它在網上漢字粵音查詢極受歡迎。稍微的缺憾,恐怕就是它只支援Big5內碼有收錄的中文字约13000字,相比《電腦用漢字粵語拼音表》的超過29000字,少上一半不止。

「黃錫凌」標準還有一個重要的特色,就是它的聲調標示。它採用了語言學家趙元任開發的「五度調值標記法」,來標示粵語的九個音調。漢語是一種「聲調語言」(註2)。普通話有四個聲調,同一個拼音的普通話在不同高低聲調下可以表達四個文字意思。粵語更加厲害,有九個聲調。不過由於所謂九個聲調,當中其實是包括三個入聲,而粵語的入聲,是收-p、-t、-k的塞音韻尾,要調出這些入聲,必須知道它們分別要由-m、-n、-ŋ等鼻音韻尾調起。譬如要調出「忽」字的聲調(fɐt7),就要由fɐn1(這個音的例字很多,如「分」、「昏」等,以下各調僅舉一個字為例)這個音調起,然後是fɐn2(例字有「粉」)、fɐn3(這個音的例字有「訓」),然後才到fɐt7。也有人在fɐn3後繼以fɐn4(例字有「焚」)、fɐn5(例字有「憤」)、fɐn6(例字有「份」),然後才調出fɐt7。這樣對於初學者可能會是一個難於掌握的程序。

新開發的粵音標調法,如「粤拼」採用了粵音只有「六聲」(而非傳統所說的「九聲」)這種學說。「六聲」學說把所有入聲獨立起來,不依附於鼻音韻尾-m、-n、-ŋ的後面,目的之一大概是減少學習者的混淆。簡化固然有簡化的好處,但同時亦會衍生「粗放」所引致的問題。入聲是什麼一種聲調呢?引用黃氏我師的說法,入聲主要是由包括粵語在內的南方方言保留下來(部分北方方言,如太原話,也有入聲)的一種有其獨特韻味的聲調;而且是古漢語之遺。以粵語為例,數字裏面的「7」(tsɐt7)、「8」(bat8)、「6」(luk9);「番茄醬牛肚麵逼客食」的「逼」(bik7)、「客」(hak8)、「食」(sik9)。「斟酒當賠禮係必殺著」的「必」(bit7)、「殺」(sat8)、「著」(dzœk9)等等。若問入聲在表達上有什麼作用,可參看前舉例子:「逼客食」或「必殺著」在講出來的時候是否很有急迫的氣勢感?因為三個入聲字叠在一起,再配合文字意義,震懾力得到加強性的表達。相信沒有人希望在説「必殺著」的時候,像唱山歌的把每字尾音拉長,再把音調轉來轉去。

不必拘泥於任何一種粵語輸入法

篇幅所限,粵語「輸入方法」趣談就此打住。文章結尾,談談我師黃氏的《粵語古趣談》。黃師專注粵語的研究及承傳,專攻尋根式的字詞考古,為我們尋回粤語詞彙被遺忘的歷史,為古今文化交流旅程作嚮導。過去黃師前後出版過《粵語古趣談》正篇、續篇、三篇,今喜見黃師又再續寫「古趣談」文章。過去出版的《粵語古趣談》系列都是採用「黃錫凌」的拼音標準,並用趙氏的「五度調值標記法」標注粵語的九聲。黃氏學生協助老師將其著作陸續數碼化的「粵語詞彙硏究所」網站,則加上谷歌預設的「耶魯」標準,以方便網絡世代的粵語輸入法用家。

就如「經濟政策貴在適時」,我們粵語用家也不必拘泥於任何一種粵語輸入方法及工具。對於會講粵語的人,谷歌透過雲端運算、人工智能和大數據等技術大幅改善的語音辨識技術,可能更加吸引。用口講畢竟一定快過用手寫,關鍵是,「電腦聽錯了幾多你所講的話?」長遠來說,科技的改進加上我們自我配合的訓練,輸入方法可能最終都會以語音辨識為主。日後有機會的話,可以談談上述幾種科技技術發展對語音辨識率改善的貢獻。

延伸閱讀

註1:2018年首季起,谷歌把推出「粵語輸入法」置於它統一的「輸入法」手機程式GBoard內,「粵語輸入法」已於Google Play下架,不再獨立發行。

註2:維基網頁有較詳盡的介紹。

黃氏