Kimi掀長文本比併潮

近日內地知名人工智能（AI）公司「月之暗面」（Moonshot AI）推出Kimi智能助手，能支援200萬字連續無損超長上下文功能。Kimi智能助手又稱Kimi Chat，是「月之暗面」自研千億參數大模型打造的對話式AI助手產品，擁有長上下文處理能力，可應用於很多新的使用場景，包括專業學術論文的理解和翻譯、輔助分析法律問題、一次性整理幾十張發票等。

據說有用戶上傳了一份完整近百萬字的中醫診療手冊，讓Kimi針對用戶問題給予診療建議。以往由於模型訓練結構所限，大模型的文本範圍都不能太長，若遇上一些複雜任務或面對大量文字資料，只能分拆文本輸入提問，但這可能會導致輸出結果上下不連貫及邏輯不通順。有了Kimi特長文本功能之後，AI可以連貫地去理解全篇上下文，更能充分理解和回答問題。相比GPT-4 Turbo支持128K上下文的功能，約相當於10萬漢字，Kimi可支援200萬漢字的上下文長度，是目前一眾大模型產品裏的長度冠軍。

Kimi今年1月下旬才突破40萬人次訪問量，但自春節開始訪問量迅速攀升，2月的訪問量超過160萬人次，僅遜於百度（09888）的文心一言與阿里巴巴（09988）的通義千問。「月之暗面」成立於2023年4月，截至目前已完成三筆融資，最新一輪融資超過10億美元，投資者包括阿里巴巴、紅杉中國、小紅書、美團（03690）等，估值達25億美元（約195億港元），是內地主要大模型獨角獸之一。

Kimi能力與GPT-4相比如何？

專家表示，根據內部評估，Kimi中英文生成能力已接近OpenAI的GPT-4，但邏輯推理方面仍有差距，主打文字生成，目前沒多模態圖片功能。至於Anthropic的Claude 3，不論是中英文生成、理解和推理、多模態圖片理解能力均與GPT-4接近，效果優於谷歌的Gemini，實際使用中其生成速度比GPT-4和Gemini更快。

隨着「月之暗面」Kimi的熱度高漲，互聯網大廠們進入了「卷」長文本比併的階段。最近阿里的通義千問宣布升級，免費開放長文檔處理功能，幫助用戶快速閱讀科研論文及研究報告、分析財務報告、研究判案、審閱醫療報告、解讀法律條文、分析考試成績、總結深度文章。

360智腦也宣布內測長文本處理功能，該功能即將入駐360AI瀏覽器，後者目前已向用戶免費開放100萬字長文本閱讀功能，一分鐘可讀完《三體》，並就文本外的「超綱」問題進行問答和延伸學習。

據悉百度下月亦會進行升級，屆時將開放長文本能力，文本範圍在200萬至500萬，大模型領域競爭霎時熾熱起來。

原刊於《信報》，本社獲作者授權轉載。