擁有截至2023年10月的知識(shí)。

OpenAI推出小模型GPT-4o Mini:在數(shù)學(xué)推理和編碼方面表現(xiàn)出色

2024-07-19 10:04:28發(fā)布     來源:多知    作者:Penny  

  多知7 月 19日消息,OpenAI今日宣布推出了小模型 —— GPT-4o Mini,其價(jià)格更實(shí)惠且性能更精簡(jiǎn)。OpenAI 表示,升級(jí)后的模型即日起向免費(fèi)用戶和付費(fèi) ChatGPT Plus 和 Team 用戶推出,并將于下周向企業(yè)客戶推出。

  GPT-4o mini以其低成本和低延遲使廣泛的任務(wù)成為可能,能夠處理大量上下文信息,支持文本和視覺輸入輸出需要高效、低成本智能解決方案的企業(yè)和技術(shù)開發(fā)者客戶支持聊天機(jī)器人、數(shù)據(jù)提取和分析工具等。

  據(jù)OpenAI介紹,GPT-4o mini支持API中的文本和視覺,未來將支持文本、圖像、視頻和音頻的輸入和輸出。該模型具有128K令牌的上下文窗口,每個(gè)請(qǐng)求支持最多16K輸出tokens,并擁有截至2023年10月的知識(shí)。得益于與GPT-4o共享的改進(jìn)分詞器,處理非英語文本現(xiàn)在更加經(jīng)濟(jì)實(shí)惠。

  根據(jù)OpenAI的數(shù)據(jù),在大規(guī)模多任務(wù)語言理解(MMLU)基準(zhǔn)測(cè)試中,GPT- 4o Mini的得分為82%,超過了其他小型模型和GPT-3.5 Turbo。MMLU測(cè)試測(cè)量了包括數(shù)學(xué)和法律在內(nèi)的57門學(xué)科的語言模型的能力。這款小模型將取代ChatGPT中的GPT-3.5 Turbo,免費(fèi)、Plus和團(tuán)隊(duì)用戶現(xiàn)在可以使用新模型。

WechatIMG610.jpg

  其中,數(shù)學(xué)和編碼能力:GPT- 4o Mini在數(shù)學(xué)推理和編碼任務(wù)方面表現(xiàn)出色,優(yōu)于市場(chǎng)上以前的小型號(hào)。在測(cè)量數(shù)學(xué)推理的MGSM測(cè)試中,GPT- 4o Mini得分為87%,而Gemini Flash得分為75.5%,Claude Haiku得分為71.7%。GPT- 4o Mini在衡量編碼性能的HumanEval中得分為87.2%,而Gemini Flash得分為71.5%,Claude Haiku得分為75.9%。

  OpenAI表示:“我們?cè)O(shè)想的未來是,模型可以無縫集成到每個(gè)應(yīng)用程序和每個(gè)網(wǎng)站上。GPT- 4o Mini為開發(fā)人員更高效、更經(jīng)濟(jì)地構(gòu)建和擴(kuò)展強(qiáng)大的人工智能應(yīng)用鋪平了道路。”

  對(duì)于企業(yè)而言,較小的模型可能適合自動(dòng)執(zhí)行大量基本任務(wù),而較大的模型可能可以處理更復(fù)雜的任務(wù)。一些企業(yè)可能會(huì)在一個(gè)應(yīng)用程序中同時(shí)使用兩者。因此,目前,很多大模型企業(yè)也都在推輕量級(jí)的小模型。