Kimi掀長文本比併潮

隨着「月之暗面」Kimi的熱度高漲,互聯網大廠們進入了「卷」長文本比併的階段。最近阿里的通義千問宣布升級,免費開放長文檔處理功能,幫助用戶快速閱讀科研論文及研究報告、分析財務報告、研究判案等。

近日內地知名人工智能(AI)公司「月之暗面」(Moonshot AI)推出Kimi智能助手,能支援200萬字連續無損超長上下文功能。Kimi智能助手又稱Kimi Chat,是「月之暗面」自研千億參數大模型打造的對話式AI助手產品,擁有長上下文處理能力,可應用於很多新的使用場景,包括專業學術論文的理解和翻譯、輔助分析法律問題、一次性整理幾十張發票等。

據說有用戶上傳了一份完整近百萬字的中醫診療手冊,讓Kimi針對用戶問題給予診療建議。以往由於模型訓練結構所限,大模型的文本範圍都不能太長,若遇上一些複雜任務或面對大量文字資料,只能分拆文本輸入提問,但這可能會導致輸出結果上下不連貫及邏輯不通順。有了Kimi特長文本功能之後,AI可以連貫地去理解全篇上下文,更能充分理解和回答問題。相比GPT-4 Turbo支持128K上下文的功能,約相當於10萬漢字,Kimi可支援200萬漢字的上下文長度,是目前一眾大模型產品裏的長度冠軍。

Kimi今年1月下旬才突破40萬人次訪問量,但自春節開始訪問量迅速攀升,2月的訪問量超過160萬人次,僅遜於百度(09888)的文心一言與阿里巴巴(09988)的通義千問。「月之暗面」成立於2023年4月,截至目前已完成三筆融資,最新一輪融資超過10億美元,投資者包括阿里巴巴、紅杉中國、小紅書、美團(03690)等,估值達25億美元(約195億港元),是內地主要大模型獨角獸之一。

Kimi能力與GPT-4相比如何?

專家表示,根據內部評估,Kimi中英文生成能力已接近OpenAI的GPT-4,但邏輯推理方面仍有差距,主打文字生成,目前沒多模態圖片功能。至於Anthropic的Claude 3,不論是中英文生成、理解和推理、多模態圖片理解能力均與GPT-4接近,效果優於谷歌的Gemini,實際使用中其生成速度比GPT-4和Gemini更快。

隨着「月之暗面」Kimi的熱度高漲,互聯網大廠們進入了「卷」長文本比併的階段。最近阿里的通義千問宣布升級,免費開放長文檔處理功能,幫助用戶快速閱讀科研論文及研究報告、分析財務報告、研究判案、審閱醫療報告、解讀法律條文、分析考試成績、總結深度文章。

360智腦也宣布內測長文本處理功能,該功能即將入駐360AI瀏覽器,後者目前已向用戶免費開放100萬字長文本閱讀功能,一分鐘可讀完《三體》,並就文本外的「超綱」問題進行問答和延伸學習。

據悉百度下月亦會進行升級,屆時將開放長文本能力,文本範圍在200萬至500萬,大模型領域競爭霎時熾熱起來。

原刊於《信報》,本社獲作者授權轉載。

車品覺