好未來正在聚焦五大場景重構(gòu)教育科技。

學(xué)而思宣布開放三項(xiàng)核心AI能力,CTO田密:教育大模型終極形態(tài)是AI老師

2024-07-08 16:28:48發(fā)布     來源:多知    作者:Penny  

  來源|多知

  作者|Penny

  7月6日,在2024世界人工智能大會(huì)的分論壇上,學(xué)而思CTO田密在《教育大模型,構(gòu)建未來個(gè)性化學(xué)習(xí)藍(lán)圖》的演講中,對(duì)大模型對(duì)教育行業(yè)的應(yīng)用和影響以及九章大模型的研發(fā)過程和落地產(chǎn)品進(jìn)行了分享。

  在演講中,田密認(rèn)為,在教育中,個(gè)性化、高質(zhì)量和大規(guī)模很難同時(shí)做到,而大模型是打破教育不可能三角的一縷曙光。

  “隨著大模型時(shí)代的到來,所有的教育AI技術(shù)都值得用大模型重做一遍。好未來正在聚焦五大場景重構(gòu)教育科技,分別是解題、對(duì)話、批改、講題和推薦。”田密說。

  田密坦陳,今天大模型發(fā)展非常迅速,但是還是在非常早期的階段。

  田密還在演講中宣布:“學(xué)而思將向全行業(yè)開放三項(xiàng)最重要的核心AI能力解題、講題和批改,各界硬件廠商,像AIPC、手機(jī)、Pad、汽車等行業(yè)都可以合作,我們希望為整個(gè)教育的數(shù)字化轉(zhuǎn)型貢獻(xiàn)需要自己的一份力量。”

  同時(shí),在2024世界人工智能大會(huì)上,田密接受了多知的訪談,他說:“教育大模型最終目標(biāo)是AI老師,即對(duì)學(xué)生24小時(shí)陪伴的老師,AI 老師可以分解為很多能力,他要自己會(huì)解題,會(huì)講題,隨時(shí)隨地解答學(xué)生問題。”

  “AI老師是終極形態(tài),但整個(gè)過程中會(huì)可能演變出很多階段性的產(chǎn)品。”田密說。

  今年9月全國即將全面落實(shí)新課標(biāo),田密對(duì)多知說:“新課標(biāo)對(duì)大模型是利好,因?yàn)樾抡n標(biāo)要求跨學(xué)科學(xué)習(xí),大模型天然是跨學(xué)科的,九章大模型也是一個(gè)全科的大語言模型,可以做到融合各科知識(shí)去講解。”

  大模型在教育領(lǐng)域的應(yīng)用最大的阻礙就在于它的幻覺問題,田密提到,學(xué)而思正通過搜索召回增強(qiáng)技術(shù)(RAG),比較有效地緩解幻覺問題,不能去消除,但是可以緩解,這使得大模型能夠比較有效應(yīng)用在實(shí)際的產(chǎn)品中去。

  RAG也就是用大模型生成之前先搜索召回相關(guān)的context拼裝到program里面去做提示詞工程,輸出就會(huì)有約束,不會(huì)胡說八道,按照指引生成對(duì)應(yīng)上下文回答。

  對(duì)于大模型在教育科技的應(yīng)用,田密對(duì)多知說:“我覺得趨勢(shì)還是逐步過渡,逐漸賦能,然后慢慢提升,潛移默化的一個(gè)過程,很難一下子到終局。”

  以下為田密分享全文:

  01

  大模型可以打破教育的不可能三角

  很多人覺得大模型對(duì)教育行業(yè)會(huì)有顛覆性影響,像Sora出來的時(shí)候很多人會(huì)問你們將來還需要輔導(dǎo)班老師嗎?我覺得今天大模型發(fā)展非常迅速,但是還沒有到徹底替換老師的地步。

  大家知道在教育行業(yè)一直有一個(gè)所謂的不可能三角理論,就是說個(gè)性化、高質(zhì)量和大規(guī)模很難同時(shí)做到,以學(xué)而思為例,最早推出了學(xué)而思培優(yōu),小班的方式可以做到高質(zhì)量和個(gè)性化,但是做不到大規(guī)模,后來做了學(xué)而思網(wǎng)校,大班的方式可以做到大規(guī)模和高質(zhì)量,但是沒有做到個(gè)性化,一個(gè)老師同時(shí)給成千上萬的孩子授課,再后來我們做了各種AI課,勉強(qiáng)可以做到個(gè)性化和大規(guī)模,但是教學(xué)質(zhì)量和真人老師還是有很大的差距。

  

  所以我們的目標(biāo)一直是沿著個(gè)性化和大規(guī)模前提下做更好的質(zhì)量,我覺得AI技術(shù)發(fā)展使得質(zhì)量提升不斷有了可能性,而大模型技術(shù)出現(xiàn)更是一縷曙光。

  學(xué)而思一直在投入做教育科技研發(fā),我們從2003年成立開始就在積累題庫數(shù)據(jù),這些都是訓(xùn)練大模型寶貴的原材料;2017年成立了AI Lab,在像語音、圖像、NLP方向做了深積累,形成教育全環(huán)節(jié)解決方案;2019年獲批承建科技部智慧教育國家新一代開放創(chuàng)新平臺(tái);2023年推出國內(nèi)教育大模型——九章大模型。

  

  其實(shí)在大模型技術(shù)出現(xiàn)之前,整個(gè)AI技術(shù)已經(jīng)賦能了教育各個(gè)環(huán)節(jié),像備、教、練、評(píng)、管各個(gè)環(huán)節(jié)。比如說備課的時(shí)候可以用AI技術(shù)幫老師自動(dòng)組講義、組卷,授課環(huán)節(jié)幫老師做授課助手,給孩子做智能答題器,幫助老師做智能提醒和個(gè)性化的學(xué)情畫像等等。比如說練習(xí)階段做自適應(yīng)練習(xí)還有中文作業(yè)批改還有整頁批改,評(píng)環(huán)節(jié)做口語評(píng)測等等,管的環(huán)節(jié)對(duì)老師生活質(zhì)量進(jìn)行各個(gè)分級(jí)評(píng)估,還有包括解決方案等等。

  教育行業(yè)已經(jīng)基于AI做了很多應(yīng)用,但是我認(rèn)為隨著大模型時(shí)代的到來,所有的教育AI技術(shù)都值得用大模型重做一遍。因?yàn)榇蠹抑喇?dāng)年人工智能是從系統(tǒng)開始誕生的,主要靠規(guī)則,再到后來的機(jī)器學(xué)習(xí),主要以汲取做大規(guī)模數(shù)據(jù)訓(xùn)練為代表,然后再到2012年深度學(xué)習(xí)所有算法轉(zhuǎn)向深度的神經(jīng)網(wǎng)絡(luò),取得了很好的結(jié)果,再到今天大模型,今天大模型的話核心基礎(chǔ)是Transformer和Attention都是2017年谷歌提出了,到今年大約七年之后終于有了大爆發(fā)。

  

  大模型這種本身也是AI技術(shù),它和傳統(tǒng)的深度學(xué)習(xí)技術(shù)有什么本質(zhì)差異呢?我覺得有三點(diǎn),對(duì)于教育行業(yè)來說:

  第一,大模型更加通用了,大家知道過去做AI服務(wù)需要上百個(gè)小模型,工作量非常大,現(xiàn)在一個(gè)大模型可以搞定所有任務(wù),訓(xùn)練成本極大地降低,訓(xùn)練效率很大提升,通用性得到很大保障。

  第二,大模型有了通用大模型作為基座,過去教育大模型只能學(xué)會(huì)教育相關(guān)的語料,今天讓通用大模型作為基座,學(xué)到更多世界知識(shí)和教育知識(shí)相融合之后會(huì)變得更加聰明,情商更高。

  第三,大模型生成式可以做多輪交互方式,使得人機(jī)交互或者師生交互更加容易、便捷、自然,Attention機(jī)制隨著語義理解也更加Robust(魯棒,即系統(tǒng)強(qiáng)壯)。

  所以今天教育技術(shù)都可以使用大模型技術(shù)全部重做一遍。

  02

  教育大模型是如何訓(xùn)練出來的?

  教育大模型到底怎么訓(xùn)練出來的,訓(xùn)練模型方式和通用大模型沒有什么本質(zhì)差別。

  我以九章大模型數(shù)據(jù)大模型為例來講它怎么訓(xùn)練的,可以發(fā)現(xiàn),大模型跟人類孩子一樣學(xué)知識(shí)的方式、手段和人類也是很相似的,比如說我們把訓(xùn)練過程分為三個(gè)階段:

  1.預(yù)訓(xùn)練(Pre-training)。它和孩子學(xué)習(xí)是什么呢?一個(gè)孩子看大量的書去學(xué),自己看學(xué),學(xué)到基本知識(shí)和理論框架。

  2.有監(jiān)督微調(diào)(Supervised Fine-Tuning)。相當(dāng)于請(qǐng)了一個(gè)老師給孩子講解標(biāo)準(zhǔn)的解題套路,孩子知道說這個(gè)題目該怎么解,向老師學(xué)習(xí)。

  3.強(qiáng)化學(xué)習(xí)(Reinforcement learning)。這個(gè)相當(dāng)于孩子不斷做多輪練習(xí),每練習(xí)一次大模型對(duì)它進(jìn)行批改和反饋,相當(dāng)于不斷進(jìn)階提升。

  

  經(jīng)過三段訓(xùn)練之后,大模型像孩子一樣學(xué)會(huì)了一個(gè)學(xué)科,比如說數(shù)學(xué)。

  其中最關(guān)鍵的是什么?是數(shù)據(jù)。你有什么樣的數(shù)據(jù)才能訓(xùn)練什么模型,所以在不同訓(xùn)練階段都需要不同的數(shù)據(jù)。比如預(yù)訓(xùn)練需要海量的題庫、講義、教輔書,有監(jiān)督微調(diào)(SFT)階段需要海量步驟清晰的解題數(shù)據(jù),強(qiáng)化學(xué)習(xí)階段需要用獎(jiǎng)勵(lì)模型做結(jié)果進(jìn)行反饋。

  我們名稱叫做九章大模型,本身布局不僅僅是數(shù)學(xué),是全學(xué)科的大模型,但是大模型和人類一樣,文科生和理科生是有區(qū)別的,我們發(fā)現(xiàn)很難在一個(gè)大模型里頭同時(shí)學(xué)好數(shù)學(xué)、語文和英語,最終我們是用多專家模型方式,有專門的數(shù)學(xué)模型、語模型、英語模型等等,最終以MoE方式組合起來做全科的服務(wù)。

  值得一提的是大模型今天應(yīng)用最大的阻礙就在于它的幻覺問題,到今天通過搜索召回增強(qiáng)技術(shù)(RAG),可以比較有效地緩解幻覺問題,不能去消除,但是可以緩解,使得大模型能夠比較有效應(yīng)用在實(shí)際的產(chǎn)品中去。

  

  RAG也就是用大模型生成之前先搜索召回相關(guān)的context拼裝到program里面去做提示詞工程,輸出就會(huì)有約束,不會(huì)胡說八道,按照你的指引生成對(duì)應(yīng)上下文回答。比如,把學(xué)生的學(xué)習(xí)畫像放進(jìn)去,就可以生成個(gè)性化的回答,這是今天大模型要落地應(yīng)用的關(guān)鍵點(diǎn)。

  03

  聚焦五大場景重構(gòu)教育科技

  我前面說大模型它教育AI所有場景都用教育大模型做一遍,直到今天到底學(xué)而思在哪些場景下已經(jīng)用大模型重構(gòu)了教育科技呢?目前我們分為五大場景,分別是解題、對(duì)話、批改、講題和推薦。

  解題即給一個(gè)題目實(shí)時(shí)解出來,我們做題庫生產(chǎn)也可以做拍搜,如果拍不到的話實(shí)施大模型解題作為兜底。

  第二個(gè)對(duì)話很容易理解,比較常見的對(duì)話能力。

  第三批改,中文、英文作業(yè)批改,比如數(shù)學(xué)題批改,現(xiàn)在有大模型之后我們數(shù)學(xué)批改可以細(xì)致到步驟級(jí)別,知道你答案是否對(duì),還知道你錯(cuò)在哪一步。

  第四個(gè)是AI大模型講題能力,很有用,AI一對(duì)一老師有了實(shí)現(xiàn)的可能性。

  最后是推薦能力,過去我們有很多地方使用了“推薦”,但是現(xiàn)在大模型前提下可以做到步驟級(jí),使得制定標(biāo)簽更加精準(zhǔn)、推薦效果更加好。

  逐步看一下幾個(gè)過程,第一是自動(dòng)解題,左邊這是一個(gè)網(wǎng)站,是非常專業(yè)的對(duì)數(shù)學(xué)能進(jìn)行評(píng)測的網(wǎng)站,目前我們九章大模型在榜單里排名第一,但是它的總分只有80多分,離100分還有比較大的差距。

  

  右邊就是我們網(wǎng)站官網(wǎng),這是一張高中的函數(shù)題,不知道大家還有多少人能做出來,大模型會(huì)自動(dòng)解,它會(huì)先分析一下題目,是考什么地方、考什么知識(shí)點(diǎn)再做一步步詳解,可以觀測到我們對(duì)公式處理非常到位,可以做流式的渲染。

  最終解完之后還有“點(diǎn)睛”,知道這個(gè)題考點(diǎn)是什么,考察什么,為什么?因?yàn)槲覀儗W(xué)而思老師都喜歡做“點(diǎn)睛”,所以大模型也學(xué)會(huì)了這一點(diǎn)。

  第二是口語對(duì)話練習(xí),這一系列比較常見,在我們ABC英語角里頭有這樣的功能,讓孩子像在游戲中學(xué)習(xí)的過程。我們會(huì)對(duì)學(xué)生的回答進(jìn)行口語評(píng)測,對(duì)流利度和發(fā)音進(jìn)行評(píng)測。

  第三個(gè)例子是批改,批改其實(shí)是非常剛需功能,對(duì)于老師和家長都一樣,比如說孩子做完之后到底做得好不好,比如說左邊是我們語文的中文作文批改,會(huì)先對(duì)字詞做判斷,到底有沒有錯(cuò)別字和用法錯(cuò)誤,對(duì)段落進(jìn)行批改,對(duì)文章進(jìn)行批改,對(duì)內(nèi)容進(jìn)行建議最后還有潤色方法,這是AI批改的五步法。右邊是英文作文也是一樣,分為三步,首先做批改,再做建議,還有最后潤色。

  

  這是數(shù)學(xué)的批改,數(shù)學(xué)批改比英文、語文更難,因?yàn)閿?shù)學(xué)題是相對(duì)更難解的,過去只能批改填空題、選擇題,到今天的話,大數(shù)據(jù)發(fā)展的話,我們批改這種大題,也就是主觀題,涉及到步驟批改,大家可以看到演示,這是已經(jīng)上到學(xué)期上了,實(shí)際過程。職業(yè)對(duì)準(zhǔn)確進(jìn)行拍批,它會(huì)對(duì)每道題進(jìn)行批改,錯(cuò)誤題標(biāo)出來進(jìn)行個(gè)性化講解。這工作非常有用,在于說學(xué)習(xí)機(jī)上有一個(gè)精準(zhǔn)學(xué),需要對(duì)孩子進(jìn)行診斷,但是孩子并不希望在學(xué)校再做一遍題目,可以把校內(nèi)試卷拿過來掃描一下,拍一下直接做冷啟動(dòng),更好做精準(zhǔn)學(xué)。

  批改功能已經(jīng)上線到學(xué)而思學(xué)習(xí)機(jī)上了,大家有興趣可以體驗(yàn)一下。

  再往下是剛剛說的講題功能,講題是大模型帶來的全新能力,在大模型之前很難做到這一點(diǎn),今年我們推出一個(gè)叫九章隨時(shí)問小程序,APP版也可以下載了,大家可以微信上搜索九章隨時(shí)問可以體驗(yàn)小程序,它是數(shù)學(xué)AI老師,不是直接給孩子答案,而是一步步講解,任何不懂過程中可以隨時(shí)打斷它做追問,可以問問題。也是拍照,自動(dòng)識(shí)別題目進(jìn)行講解,它會(huì)做各種設(shè)問引導(dǎo)孩子回答,可以直接語音輸出不用敲字了,不懂的話可以直接提問為什么要進(jìn)行平方呢?如果你問了不相關(guān)的東西它會(huì)把你拉回來。最后總結(jié)要點(diǎn),還會(huì)舉一反三給你更多拓展問題。

  大家可以看到AI老師像真人老師一樣,不想孩子直接拿到答案還是逐步講解,任何不懂的問題可以做追問、做回答,可以舉一反三,大家可以微信搜索九章隨時(shí)問小程序進(jìn)行體驗(yàn)。

  最后還有一個(gè)應(yīng)用藏在后面叫推薦,其實(shí)精準(zhǔn)學(xué)或者個(gè)性化學(xué)習(xí)最核心就是做題目推薦。過去我們做診斷,只能精確到題目級(jí)別,比如這道題考察的是二次根式的化簡求值,一個(gè)知識(shí)點(diǎn),但是實(shí)際上這個(gè)題目我們拆成三個(gè)步驟解答,每個(gè)步驟會(huì)考察更細(xì)的知識(shí)點(diǎn),做了第一步、做第二步錯(cuò)法是不一樣的,大模型對(duì)每個(gè)步驟打標(biāo)簽,使得對(duì)題目錯(cuò)因判斷更加精準(zhǔn),從而使得推薦效果也是更加精準(zhǔn)。

  

  比如這個(gè)例子,錯(cuò)的第一步可能是對(duì)不等式本身不了解,對(duì)定義與性質(zhì)包括對(duì)去括號(hào)不了解,這是做了更加細(xì)致的推薦過程。

  04

  向全行業(yè)開放“解題、講題和批改”三大核心AI能力

  到今天學(xué)而思我們借著WAIC現(xiàn)場,也宣布我們會(huì)把學(xué)而思打造的三項(xiàng)最重要的核心AI能力解題、講題和批改,向全行業(yè)做開放,為什么這樣做呢?實(shí)際上我覺得今天整個(gè)AI大模型對(duì)教育行業(yè)的影響也好、賦能也好還是非常早期的階段。

  我覺得基于這樣的AI能力,到底能打造出什么樣好的AI產(chǎn)品在培訓(xùn)機(jī)構(gòu)、公立校、家內(nèi)的學(xué)習(xí)場景下到底有什么好的產(chǎn)品和效果出現(xiàn),都還是很早期的階段,所以今天我們希望把核心能力開放給行業(yè)的所有參與者,包括像各界硬件廠商,像AIPC、手機(jī)、Pad、汽車,都可以和我們談合作,包括我們的一些公立學(xué)校2B2C應(yīng)用,希望把大模型應(yīng)用能力真正用到教育行業(yè)方面,也為整個(gè)教育的數(shù)字化轉(zhuǎn)型貢獻(xiàn)需要自己的一份力量。

  最后我覺得教育大模型還是有一個(gè)終極夢(mèng)想,很多人擔(dān)心AI大模型會(huì)不會(huì)顛覆教育行業(yè),會(huì)不會(huì)讓AI老師真正代替真人老師,我答案是不會(huì)的。我們認(rèn)為大模型會(huì)給每個(gè)老師配備一個(gè)AI助教,每個(gè)孩子配備一個(gè)AI學(xué)伴,但是老師有很多固定工作,比如說備課、作業(yè)批改,這些重復(fù)工作都可以用AI大模型替代它,老師可以把精力更加集中在對(duì)孩子的關(guān)愛上、喚醒激發(fā)鼓舞上,孩子配備AI學(xué)伴,24小時(shí)在線陪伴他學(xué)習(xí)成長,他有任何問題都可以向AI學(xué)伴進(jìn)行詢問,因?yàn)樗麤]有任何壓力,孩子不用擔(dān)心問的問題很愚蠢,也不用擔(dān)心AI講幾遍才能聽明白,也不擔(dān)心孩子問的問題是不是超綱或者有些跨學(xué)科的問題, AI都可以搞定這個(gè)事情。

  讓孩子會(huì)更加保持對(duì)學(xué)習(xí)的樂趣,對(duì)學(xué)習(xí)的自信心,我覺得這才是教育行業(yè)為大模型賦能的終極意義所在。

  今天我的演講到這兒,謝謝大家!

  相關(guān)閱讀:

  大模型重構(gòu)學(xué)習(xí)機(jī):學(xué)而思學(xué)習(xí)機(jī)全面披露“小思”AI功能

  學(xué)而思推出數(shù)學(xué)答疑原生AI工具九章隨時(shí)問,“AI將重新定義教育行業(yè)”

  學(xué)而思迭代其首款學(xué)習(xí)機(jī):配備10大AI神器,支持新課標(biāo)內(nèi)容

  暴走WAIC:跟AI+教育有關(guān)的,都在這兒↑

  END

  本文作者:Penny