人工智能(AI)聊天機器人程式ChatGPT是一套利用深度學習(Deep Learning, DL)技術開發的自然語言處理(Natural Language Processing, NLP)軟件。與其他同類NLP軟件相比,它擁有「生成式AI」(Generative AI)功能。
分3步寫文章 難確保可靠性
什麼是「生成式AI」呢?AI的目標是模仿人類行為,就此ChatGPT可以定性為一個「自動作家」;簡單而言,ChatGPT能夠根據用戶所提出的要求,例如老師分配的功課課題,自動生成(即編寫)貼題的文章,過程分3步進行:
1. 檢索:ChatGPT首先從其內置的超大型文本數據庫中,搜索出相關的文本,因應用戶的背景,將文本進行個性化的排序。例如搜索結果是甲、乙、丙3篇文本,張三醫生的搜索文本排序可能是乙、丙、甲,而李四老師的文本排序卻可能是丙、甲、乙,兩人的排序截然不同。
2. 分析:ChatGPT會進一步分析各篇文本,去理解它的內容。且看以上案例,由於張三和李四的文本序列不同,再加上他們各有各的關注點(例如文本中的關鍵詞),系統會據此仿效他們每一個人的分析方法,而對文本作出不同的理解和分析。
3. 編寫:最後ChatGPT會融滙上一步的分析結果,並根據用戶(張三、李四)的寫作風格(例如其用詞的習慣),生成總結文章。
投資者吹捧 唯專家稱無創意
ChatGPT的執行過程中追求個人化(personalization),是系統的特點之一。有AI專家指出,ChatGPT並無太大創意,它不外乎是一套通過第三代生成形預訓練變換模型(Generative Pre-trained Transformer 3, GPT-3)開發而成的應用系統而已;之所以它能熱爆全球,主要是因為其投資者(尤其是微軟)的大力吹捧,他們硬推甚至乎吹噓其效能及潛在商業價值,但筆者對這觀點很有保留。
首先,ChatGPT的效能還未完全獲得科學界的肯定。理論上,ChatGPT所採用的AI算法只滿足了應用上的必須條件(necessary condition),但未完全能滿足充分條件(sufficient condition),所以它輸出的文章有機會包含錯誤的內容。
由於每篇文章個人化、主觀性強,而ChatGPT所用的訓練數據文集是通用的,因此AI工程師在開發過程中難以全面測試輸出內容的準確度(accuracy)和覆蓋率(coverage),以確保生成文章的可靠性。事實上,過去在多次公開演示中,ChatGPT只會泛泛而談,有時甚至答非所問。
妥善使用 只宜做教師「小助力」
另外,大家要注意的是ChatGPT所潛在之文化衝擊。由於ChatGPT主要是利用英語文集訓練而創造的聊天機器人,它與用戶對答(或編寫文章)時,很自然會帶有西方文化思維,因此在某些場景中非西方用戶(例如中國人)並不適宜應用,例如在政治討論(聊天)中文化差異可能會導致不必要的誤會。
又例如在輔助互聯網搜尋的應用中,ChatGPT透過聊天功能引導用戶查詢決策,如此用戶便難免會被西方思想潛移默化,間接地被「洗腦」,影響其判斷。
在教與學方面,筆者認為不妥善使用ChatGPT會阻礙學習,並多次提醒學生不宜過分依賴ChatGPT,「請槍」做功課;然而,ChatGPT可用作為教師「小助力」,例如教師可以利用它來編撰課程教材,節省的時間和工夫可用於內容設計上。不過,老師必須做好把關,例如平衡內容中不同文化、論點的融合。
原刊於《經濟日報》,本社獲作者授權轉載。