國內首個專為數(shù)學打造的大模型。

好未來數(shù)學大模型MathGPT來了!CTO田密:希望用AI實現(xiàn)大規(guī)模因材施教

2023-08-24 13:15:42發(fā)布     來源:多知網    作者:王上  

  來源|多知網

  作者|王上

  圖片來源|多知網

  多知網8月24日消息,在好未來20周年直播活動中,CTO田密宣布好未來推出自研的數(shù)學領域千億級大模型MathGPT并開啟內測。即日起,用戶可通過官網(www.mathgpt.com)申請注冊賬號免費試用體驗。

  今年5月,好未來曾公布正在進行自研數(shù)學大模型的研發(fā),命名為MathGPT。MathGPT是面向全球數(shù)學愛好者和科研機構,以解題和講題算法為核心的數(shù)學垂直領域的大模型,也是國內首個專為數(shù)學打造的大模型。

  經過100多天的打磨,MathGPT正式推出了。區(qū)別于通用大模型,用戶使用MathGPT時,可以用文字或圖片方式上傳數(shù)學題,即可得到對話式的解答反饋,也可以通過“隨機來一題”的按鈕,隨機生成數(shù)學題目并由系統(tǒng)給出解答。目前,MathGPT支持中文、英文版本的PC端和移動端體驗。

  

  01

  底層是對數(shù)學解題能力

  田密介紹,MathGPT匯集了好未來多年教育教研數(shù)據(jù)積累,專注于數(shù)學領域。千億級大模型的訓練、推理、部署框架為模型賦能。通過優(yōu)質教育數(shù)據(jù),實現(xiàn)題目計算、講解、問答等多任務持續(xù)訓練和有監(jiān)督微調。此外,借助人類反饋對齊,還將進一步提升模型綜合素養(yǎng)。根據(jù)好未來介紹,MathGPT在解題準確率、穩(wěn)定性及用戶體驗方面均有明顯的優(yōu)勢。

  MathGPT官網顯示,MathGPT的數(shù)學計算能力已覆蓋小學、初中、高中的數(shù)學題,題目類型涵蓋計算題、應用題、代數(shù)題等多個類型,還可以針對題目進行追問,暫未開放數(shù)學之外的問答互動。

  

  MathGPT技術報告

  MathGPT技術報告顯示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數(shù)學和Math401等6個公開數(shù)學評測集合的測試結果中,好未來的MathGPT取得了多項測試的最高分數(shù)。同時,MathGPT在C-Eval的初高中的全科測試集合上也均有不錯的表現(xiàn)。

  

  MathGPT在C-Eval榜單初高中各科成績

  在解題穩(wěn)定性、講解友好度方面,MathGPT基于海量名師解題過程的數(shù)據(jù)進行模型訓練,模型的解題步驟專業(yè)清晰。

  多知網第一時間進行了測試,MathGPT輸入框左側有一個“Σ”符號,點開可以輸入各種數(shù)學符號,編輯數(shù)學公式。

  

  此外,MathGPT支持圖片識別的功能非常適合數(shù)理化科目,因為數(shù)理化的題目中有很多符號和圖形,手動輸入不方便,或者不能實現(xiàn)手動輸入,而支持圖片正好解決了這個痛點。

  如多知網用圖片測試了一道高一數(shù)學題目,MathGPT很快給出了解答,并且解題過程很細致,包含“分析”、“詳解”、“點睛”三個部分。其中,“分析”提供了題目的解題思路、思考方式,幫助用戶更好地理解題目,“詳解”則給出具體的計算方式和答案,最后“點睛”的環(huán)節(jié),對題目的考點、難點、關鍵點進行提示,幫助用戶回顧反思出題意圖、舉一反三。也就是說,MathGPT像一個老師一樣拆解了題目的要點。

  

  

  (多知網測試)

  在好未來看來,對于使用者而言,研究數(shù)學問題不僅在于得到答案本身,更在于答案背后的解題原理、思路邏輯。與其他通用大模型相比,MathGPT能實現(xiàn)更高準確度的解題,也能把答案解析得更清楚、講解得更明白,更好地滿足用戶使用AI產品解答數(shù)學問題的核心需求。

  在MathGPT發(fā)布同時,好未來也在官網更新了一個具有代表性和挑戰(zhàn)性的數(shù)學任務評測集,供全球人工智能專家、數(shù)學愛好者體驗和測評。田密介紹,希望讓MathGPT在數(shù)學教育領域發(fā)揮更大作用,好未來愿意把基于大規(guī)模、高質量的內容的千億級大模型研發(fā)經驗方法和業(yè)內分享,和行業(yè)共同進步。

  02

  聚焦垂直大模型,“做難而正確的事情”

  在AI浪潮的推動下,今年以來多家科技公司宣布推出通用大語言模型產品,而好未來選擇了另一個方向,不基于將現(xiàn)有大語言模型做微調和接口調用、不做通用大語言模型,而是深入數(shù)學的垂直領域研發(fā)大模型,致力于打造自主、穩(wěn)定、可持續(xù)、高質量的數(shù)學解決方案。

  通用大模型“重文輕理”,在數(shù)學問題的解決、講解、問答和推薦方面則存在明顯的短板。而在另一個層面,在通往通用人工智能的路上,數(shù)學推理能力很重要,全球有很多大型公司在做這方面的研究。

  “好未來在數(shù)學的數(shù)據(jù)和業(yè)務上有20年的積累,有大量的教育數(shù)據(jù)的積累和持續(xù)生產教育數(shù)據(jù)的能力,所以選擇做這個難而正確的事情。”田密稱,好未來希望用自己在數(shù)學和AI上的多年積累,做好AI大模型時代的數(shù)學基礎工作。

  早在2017年,好未來便成立了AI lab人工智能實驗室?;谥腔劢逃斯ぶ悄荛_放創(chuàng)新平臺助力,好未來AI lab獲得各類頂級學術會議比賽冠軍16項,亞軍6項,發(fā)表國際期刊和會議高水平學術論文近百篇。

  2019年,科技部宣布依托好未來建設智慧教育國家新一代人工智能開放創(chuàng)新平臺,好未來成為教育行業(yè)首批唯一一家人工智能“國家隊”成員,在人工智能領域有多年深入研究。多年來,好未來以教育行業(yè)重大需求為牽引,構建了面向教育的人工智能算法能力、應用解決方案、基礎軟硬件體系和開源開放服務的國家教育科技創(chuàng)新平臺。

  好未來也在積極參與推動大模型標準體系建設,先后作為核心單位參與了由國家人工智能標準化總體組組織的大模型系列國家標準、中國信通院牽頭編制的“大模型預訓練模型技術和應用評估方法”系列團體標準,以及教育部教育信息化技術標準委員會暨全國信息技術標準化技術委員會主導的“教育通用大模型”系列標準編制工作。

  近期,好未來正作為牽頭單位與中國信通院、復旦大學、科大訊飛、百度等行業(yè)科研機構、高校、企業(yè)一同編制教育大模型團體標準,從覆蓋場景、應用成效、服務可靠等維度全面評估教育大模型能力,為教育大模型應用落地提供參考與指導。

  03

  希望用AI實現(xiàn)大規(guī)模因材施教

  隨著大語言模型的興起,如何用AI技術服務各行各業(yè)是社會關注的焦點。教育行業(yè)是最早開始布局AI領域的行業(yè)之一,AI能為教育生態(tài)帶來何種變化一直備受關注。

  “AI帶來了重新定義教育行業(yè)的機會,大模型技術使得大規(guī)模的因材施教真正有了實現(xiàn)的可能。”田密介紹,20年來,好未來一直在探索個性化學習,從線下小班到線上大班,再到AI課,形式不斷進化,但教的內容始終是固定的、學生和老師互動較少、顆粒度只能到題目級別。

  田密認為,大模型的本質,是一種更高效的、從數(shù)據(jù)中學習知識并加以應用的方式。在AI能力的加持下,“學生自學+AI答疑”的新型學習方式成為廣泛的可能。學習者獲得優(yōu)質教學內容的門檻、成本降低,獲得的教學內容個性化、精細化程度持續(xù)升高,可以實現(xiàn)千人千面的AI教學和答疑輔導,每個學生都能得到最適合自己的學習內容。

  以MathGPT為基礎,好未來將不斷探索AI環(huán)境下的學習方式,更好地服務于全球的學習者、數(shù)學愛好者,并將經驗及時與行業(yè)分享,通過AI技術助力教育科技的積極改變。

  據(jù)田密介紹,隨著公測的順利進行,MathGPT的解題能力將得到持續(xù)提升,基于MathGPT的產品級應用也正在加速研發(fā)中,將于近期發(fā)布。