ChatGPT潛在文化衝擊小心西方思想「洗腦」

人工智能（AI）聊天機器人程式ChatGPT是一套利用深度學習（Deep Learning, DL）技術開發的自然語言處理（Natural Language Processing, NLP）軟件。與其他同類NLP軟件相比，它擁有「生成式AI」（Generative AI）功能。

分3步寫文章難確保可靠性

什麼是「生成式AI」呢？AI的目標是模仿人類行為，就此ChatGPT可以定性為一個「自動作家」；簡單而言，ChatGPT能夠根據用戶所提出的要求，例如老師分配的功課課題，自動生成（即編寫）貼題的文章，過程分3步進行：

1. 檢索：ChatGPT首先從其內置的超大型文本數據庫中，搜索出相關的文本，因應用戶的背景，將文本進行個性化的排序。例如搜索結果是甲、乙、丙3篇文本，張三醫生的搜索文本排序可能是乙、丙、甲，而李四老師的文本排序卻可能是丙、甲、乙，兩人的排序截然不同。

2. 分析：ChatGPT會進一步分析各篇文本，去理解它的內容。且看以上案例，由於張三和李四的文本序列不同，再加上他們各有各的關注點（例如文本中的關鍵詞），系統會據此仿效他們每一個人的分析方法，而對文本作出不同的理解和分析。

3. 編寫：最後ChatGPT會融滙上一步的分析結果，並根據用戶（張三、李四）的寫作風格（例如其用詞的習慣），生成總結文章。

投資者吹捧唯專家稱無創意

ChatGPT的執行過程中追求個人化（personalization），是系統的特點之一。有AI專家指出，ChatGPT並無太大創意，它不外乎是一套通過第三代生成形預訓練變換模型（Generative Pre-trained Transformer 3, GPT-3）開發而成的應用系統而已；之所以它能熱爆全球，主要是因為其投資者（尤其是微軟）的大力吹捧，他們硬推甚至乎吹噓其效能及潛在商業價值，但筆者對這觀點很有保留。

首先，ChatGPT的效能還未完全獲得科學界的肯定。理論上，ChatGPT所採用的AI算法只滿足了應用上的必須條件（necessary condition），但未完全能滿足充分條件（sufficient condition），所以它輸出的文章有機會包含錯誤的內容。

由於每篇文章個人化、主觀性強，而ChatGPT所用的訓練數據文集是通用的，因此AI工程師在開發過程中難以全面測試輸出內容的準確度（accuracy）和覆蓋率（coverage），以確保生成文章的可靠性。事實上，過去在多次公開演示中，ChatGPT只會泛泛而談，有時甚至答非所問。