“國產(chǎn)全自研、中文能力比肩GPT-4”

新一代基座大模型GLM-4來了!智譜AI將發(fā)起大模型開源基金

2024-01-17 12:29:58發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)1月17日消息,智譜AI16日舉辦首屆技術開放日(Zhipu DevDay)?,F(xiàn)場,智譜AI團隊全面展示了其投身于大模型事業(yè)三年多來所積累的技術成果,并重磅發(fā)布了新一代基座大模型GLM-4。

  根據(jù)此次GLM-4的發(fā)布及上線,是智譜AI大模型研發(fā)上的關鍵突破。智譜AI首席執(zhí)行官張鵬介紹,GLM-4的整體性能相比上一代大幅提升,逼近GPT-4。它可以支持更長的上下文,具備更強的多模態(tài)能力。同時,它的推理速度更快,支持更高的并發(fā),大大降低推理成本。除此之外,GLM-4大幅提升了智能體能力,GLM-4 All Tools 實現(xiàn)自主根據(jù)用戶意圖,自動理解、規(guī)劃復雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和多模態(tài)文生圖大模型以完成復雜任務。GLMs 個性化智能體定制功能亦同時上線,用戶用簡單的提示詞指令就能創(chuàng)建屬于自己的 GLM 智能體。

c21f9af0e7e82d06276239755b0079b9.jpg

  具體來說,GLM-4可以支持128k的上下文窗口長度,單次提示詞可以處理的文本可以達到300頁。同時,在needle test(大海撈針)測試中,128K文本長度內(nèi)GLM-4 模型均可做到幾乎100%的精度召回,并未出現(xiàn)長上下文全局信息因為失焦而導致的精度下降問題。同時,多模態(tài)能力方面,文生圖和多模態(tài)理解都得到了增強。

  此外,GLM-4的All Tools能力全新發(fā)布。得益于GLM模型的強大Agent能力,GLM-4實現(xiàn)了自主根據(jù)用戶意圖,自動理解、規(guī)劃復雜指令,自由調(diào)用網(wǎng)頁瀏覽器、Code Interpreter代碼解釋器和文生圖CogView3模型。同時,GLM-4 通過代碼解釋器,會自動調(diào)用代碼解釋器進行復雜的方程或者微積分求解。對比GSM8K、Math以及Math23K三個數(shù)據(jù)集上的結果,GLM-4 All Tools取得和GPT-4 All Tools相當?shù)男Ч?。GLM-4的All Tools能力完全自動,而且可以處理各種任務,比如包括文件處理、數(shù)據(jù)分析、圖表繪制等復雜任務,支持處理 Excel、PDF、PPT 等格式的文件。

  GLMs個性化智能體定制能力也同步上線?;贕LM-4模型的強大能力,用戶只要登錄智譜清言官方網(wǎng)站,用簡單的提示詞指令就能創(chuàng)建屬于自己的GLM智能體。并且,用戶可以通過全新上線的智能體中心分享自己創(chuàng)建的各種智能體。GLM模型智能體的推出標志著任何人都能夠自由運用GLM-4模型并挖掘它的潛力,沒有任何編程基礎也能夠?qū)崿F(xiàn)大模型的便捷開發(fā)。這是智譜AI為降低大模型使用門檻所做的最新努力。

WechatIMG33.jpg

  此前,智譜AI分別聯(lián)合CCF中國計算機學會、中國中文信息學會社會媒體處理專委會發(fā)起了CCF-智譜大模型基金、SMP-智譜大模型交叉學科基金,用于支持大模型理論、算法、模型、應用等相關研究和跨領域交叉創(chuàng)新。去年兩支基金為來自全國三十余所高校參與的41個研究項目累計提供了超1000萬元現(xiàn)金和算力資源的科研支持。

  2024年,智譜AI也將發(fā)起開源開放的大模型開源基金,該計劃包括三個“一千”:智譜AI將為大模型開源社區(qū)提供一千張卡,助力開源開發(fā);提供1000萬元的現(xiàn)金用來支持與大模型相關的開源項目;為優(yōu)秀的開源開發(fā)者提供1000億免費API tokens。張鵬表示,大模型開源基金的目的在于推動大模型研發(fā)的大進展,促進大模型整個開源生態(tài)的大繁榮。面對全球的大模型創(chuàng)業(yè)者,智譜AI也將“Z計劃”進一步升級,聯(lián)合生態(tài)伙伴發(fā)起總額10億人民幣的大模型創(chuàng)業(yè)基金用于支持大模型原始創(chuàng)新,覆蓋大模型算法、底層算子、芯片優(yōu)化、行業(yè)大模型和超級應用等方向

  2024年被業(yè)界普遍認為是人工智能發(fā)展歷史上的又一重要年份。張鵬認為,2024將是AGI元年。他表示:“大模型創(chuàng)新研發(fā)是一條長征路,一枝獨秀不是春,我們希望與人工智能行業(yè)所有的參與者、產(chǎn)業(yè)鏈上下游合作伙伴、開發(fā)者社區(qū)、學術界一同努力,為中國AI新未來貢獻綿薄之力。”

  智譜AI于2020年底開始研發(fā)GLM預訓練架構,2021年訓練完成百億參數(shù)模型GLM-10B,同年利用MoE架構成功訓練出收斂的萬億稀疏模型,2022年合作研發(fā)了中英雙語千億級超大規(guī)模預訓練模型GLM-130B。2023年,智譜AI推出了基于千億基座的對話模型ChatGLM,并開源單卡版模型ChatGLM-6B,使得研究者和個人開發(fā)者進行本地微調(diào)和部署成為可能。

  目前,針對B端企業(yè)的模型訓練、微調(diào)、部署等服務,是智譜AI的主要業(yè)務形式,其合作伙伴包括有道、火山引擎等。

  公開資料顯示,智譜AI是國內(nèi) AI 領域獨角獸企業(yè),其背后的投資方包括美團、阿里、螞蟻集團、高瓴資本等多家投資機構。(多知網(wǎng) Penny)