OpenAI推出小模型GPT-4o Mini：在數(shù)學(xué)推理和編碼方面表現(xiàn)出色

2024-07-19 10:04:28發(fā)布來源：多知作者：Penny

　　多知7 月 19日消息，OpenAI今日宣布推出了小模型 —— GPT-4o Mini，其價(jià)格更實(shí)惠且性能更精簡(jiǎn)。OpenAI 表示，升級(jí)后的模型即日起向免費(fèi)用戶和付費(fèi) ChatGPT Plus 和 Team 用戶推出，并將于下周向企業(yè)客戶推出。

　　GPT-4o mini以其低成本和低延遲使廣泛的任務(wù)成為可能，能夠處理大量上下文信息，支持文本和視覺輸入輸出需要高效、低成本智能解決方案的企業(yè)和技術(shù)開發(fā)者客戶支持聊天機(jī)器人、數(shù)據(jù)提取和分析工具等。

　　據(jù)OpenAI介紹，GPT-4o mini支持API中的文本和視覺，未來將支持文本、圖像、視頻和音頻的輸入和輸出。該模型具有128K令牌的上下文窗口，每個(gè)請(qǐng)求支持最多16K輸出tokens，并擁有截至2023年10月的知識(shí)。得益于與GPT-4o共享的改進(jìn)分詞器，處理非英語文本現(xiàn)在更加經(jīng)濟(jì)實(shí)惠。

　　根據(jù)OpenAI的數(shù)據(jù)，在大規(guī)模多任務(wù)語言理解(MMLU)基準(zhǔn)測(cè)試中，GPT- 4o Mini的得分為82%，超過了其他小型模型和GPT-3.5 Turbo。MMLU測(cè)試測(cè)量了包括數(shù)學(xué)和法律在內(nèi)的57門學(xué)科的語言模型的能力。這款小模型將取代ChatGPT中的GPT-3.5 Turbo，免費(fèi)、Plus和團(tuán)隊(duì)用戶現(xiàn)在可以使用新模型。

　　其中，數(shù)學(xué)和編碼能力：GPT- 4o Mini在數(shù)學(xué)推理和編碼任務(wù)方面表現(xiàn)出色，優(yōu)于市場(chǎng)上以前的小型號(hào)。在測(cè)量數(shù)學(xué)推理的MGSM測(cè)試中，GPT- 4o Mini得分為87%，而Gemini Flash得分為75.5%，Claude Haiku得分為71.7%。GPT- 4o Mini在衡量編碼性能的HumanEval中得分為87.2%，而Gemini Flash得分為71.5%，Claude Haiku得分為75.9%。

　　OpenAI表示:“我們?cè)O(shè)想的未來是，模型可以無縫集成到每個(gè)應(yīng)用程序和每個(gè)網(wǎng)站上。GPT- 4o Mini為開發(fā)人員更高效、更經(jīng)濟(jì)地構(gòu)建和擴(kuò)展強(qiáng)大的人工智能應(yīng)用鋪平了道路。”

　　對(duì)于企業(yè)而言，較小的模型可能適合自動(dòng)執(zhí)行大量基本任務(wù)，而較大的模型可能可以處理更復(fù)雜的任務(wù)。一些企業(yè)可能會(huì)在一個(gè)應(yīng)用程序中同時(shí)使用兩者。因此，目前，很多大模型企業(yè)也都在推輕量級(jí)的小模型。

商學(xué)院

Open Talk

OpenAI推出小模型GPT-4o Mini：在數(shù)學(xué)推理和編碼方面表現(xiàn)出色

相關(guān)閱讀