打通系統(tǒng)和人的配合是最大挑戰(zhàn)。

新東方考研探索AI這一年

2024-12-09 19:37:00發(fā)布     來源:多知    作者:徐晶晶  

  來源|多知

  作者|徐晶晶

  多年來,新東方一直是考研領(lǐng)域的頭部選手。每年數(shù)十萬的用戶體量,也意味著用戶群的龐大、多元與細(xì)分。基于此,近兩年,新東方考研業(yè)務(wù)的關(guān)鍵詞便是為不同用戶提供更具針對性的服務(wù)。

  在近日舉行的發(fā)布會上,新東方宣布其自主研發(fā)的“新東方在線”App鴻蒙原生版正式上線,同時在“新東方在線”App鴻蒙原生版上線了全新升級的考研智能學(xué)習(xí)系統(tǒng)“慧學(xué)系統(tǒng)”,以期提升學(xué)生學(xué)習(xí)體驗。

  新東方也在這次發(fā)布會上首次對外公開考研業(yè)務(wù)AI落地的戰(zhàn)略布局。就整個新東方集團(tuán)而言,考研也是率先落子AI的業(yè)務(wù)板塊之一。

  01

  新東方考研探索AI之路:“復(fù)刻老師的教學(xué)經(jīng)驗和教研經(jīng)驗”

  “慧學(xué)系統(tǒng)”是新東方考研落地AI功能的集大成者,升級了“學(xué)”“練”“測”等環(huán)節(jié)。整體來看,盡管直到2024年年末才正式披露AI研發(fā)進(jìn)展,但如果將前期探索算上,新東方考研在AI這條路上已跋涉了兩年之久。

  早期,新東方考研的探索集中在內(nèi)部提效。例如借助AI拆解課程知識點并進(jìn)行個性化匹配等。

  到了2024年8月,新東方考研已在全國分校大范圍落地“AI批改”這一核心應(yīng)用,幫助老師減輕批改作業(yè)的負(fù)擔(dān)。

  而當(dāng)下,新東方考研則研發(fā)了AI自生產(chǎn)題目系統(tǒng),后者可根據(jù)學(xué)科核心知識點和考察難度自動生成考研模擬題。

  從最開始將AI用于提效的淺層動作,到今天用AI批改、出題等更深層次的教學(xué)教研內(nèi)容,一步一步,新東方考研在AI這條路上越邁越遠(yuǎn)。

  新東方大學(xué)生學(xué)習(xí)與發(fā)展中心產(chǎn)品研發(fā)高級總監(jiān)袁榮表示:“我們所有AI動作的主線都是‘復(fù)刻老師的教學(xué)經(jīng)驗和教研經(jīng)驗’,即把新東方優(yōu)秀老師可以做到的事情用AI復(fù)現(xiàn)出來,讓AI跟老師協(xié)同合作,提供給學(xué)生更好的服務(wù)。”

  “我們一切動作的出發(fā)點都是為了更好地解決學(xué)生的需求和效率的問題。”新東方大學(xué)生學(xué)習(xí)與發(fā)展中心在線國內(nèi)事業(yè)部總經(jīng)理洪喆總結(jié)道。

  具體來看,AI批改,為什么是團(tuán)隊率先找到的重點場景?

  新東方大學(xué)生學(xué)習(xí)與發(fā)展中心考研項目總監(jiān)李琳向多知分析,這一方面是源于學(xué)生的需求。每年,新東方都會調(diào)研考研學(xué)員需求,其中動態(tài)的學(xué)習(xí)規(guī)劃和答疑是歷屆學(xué)員的共性剛需。AI批改功能則是考研群體眾多核心需求場景(含答疑場景)的交集。

  更為現(xiàn)實的需求是,由于寫作是學(xué)生可以提升的重要單項,批改作文也就成了師生們在考研高峰期的集中需求。老師批改作文的速度與質(zhì)量則直接影響學(xué)生的滿意度。

  “整個AI批改體系核心的業(yè)務(wù)邏輯是讓學(xué)生做測試練習(xí)以檢驗學(xué)習(xí)效果,對學(xué)生來說意義很大,也是我們了解學(xué)生的重要方式之一。”袁榮補(bǔ)充道。

  據(jù)團(tuán)隊透露,目前,AI批改功能支持考研全部科目客觀題以及考研英語主觀題和作文批改,并即將實現(xiàn)考研數(shù)學(xué)的主觀題批改,經(jīng)測試使用AI批改的準(zhǔn)確率均達(dá)到97%以上,經(jīng)人工校準(zhǔn)后可實現(xiàn)接近100%準(zhǔn)確率。

  這些數(shù)字砌起的壁壘之下,是一段極其漫長的探索之路。

  單就批改而言,盡管K12領(lǐng)域的AI批改產(chǎn)品豐富、技術(shù)相對成熟,但無法直接復(fù)用于考研場景。因為考研業(yè)務(wù)的AI批改研發(fā)難度要遠(yuǎn)高于K12業(yè)務(wù),例如考研數(shù)學(xué)主觀題的批改模型訓(xùn)練,新東方必須要從無到有地訓(xùn)練出能夠匹配考研場景的批改模型。所謂批改,不是針對某一個考研單項的批改,而是要針對學(xué)生所有類型的需求提供全方位的AI批改解決方案。既涉及考研的多科目、多題型,還牽涉不同的細(xì)分需求場景,諸如作業(yè)場景的批改、答疑場景的批改、線下考試場景的批改等。

  以考研數(shù)學(xué)的主觀題批改為例,團(tuán)隊需要攻克兩個挑戰(zhàn)——圖像識別和邏輯推理,這也是目前市面上的大模型還無法完美解決的問題:

  第一道坎是紙質(zhì)公式的識別。AI得先識別學(xué)生寫的是什么,比如考研數(shù)學(xué)里的微分符號、積分符號等。

  第二道坎在于,即使識別正確,但在高等數(shù)學(xué)方面,AI 的推理能力還沒有過關(guān),這遠(yuǎn)比K12數(shù)學(xué)的推理要復(fù)雜得多。

  而這兩個問題的解決,關(guān)涉業(yè)務(wù)前景和學(xué)生體驗,對新東方考研來說是非常重要的事情。我們愿意花更多的時間精力結(jié)合擁有的教學(xué)、用戶的數(shù)據(jù)和場景做這件事情。”袁榮說道。

  為了解決這兩個挑戰(zhàn),團(tuán)隊“無所不用其極”,“針對目前 AI 的短板和缺陷,通過將老師的經(jīng)驗融入我們的混合技術(shù)系統(tǒng)里,給現(xiàn)有的基礎(chǔ)能力打補(bǔ)丁、做升級,從而去解決上述缺陷。”

  當(dāng)然,有了AI批改,也并不意味著到達(dá)了解決問題的終點。新東方并沒有直接將AI批改的結(jié)果呈現(xiàn)給學(xué)生,而是由老師們多次校正AI的批改結(jié)果。

  袁榮解釋:“在把所有結(jié)果給到學(xué)生之前,老師會復(fù)核一遍結(jié)果。復(fù)核不同于批改,如果批改要花 10 分鐘,復(fù)核可能只花 30 秒,這會導(dǎo)致我們整個的吞吐能力和響應(yīng)速度會大幅提升。這樣既能避免 AI 的不足之處對學(xué)生的學(xué)習(xí)效果產(chǎn)生實質(zhì)性的影響,同時也能保證老師給出學(xué)生反饋的時效性。所以我們基本上是用人和系統(tǒng)的磨合,解決人的產(chǎn)能短板,用人的把控來解決系統(tǒng)的幻覺問題,這兩個結(jié)合到一起之后才是我們交給學(xué)生最終的解決方案。”

  AI生題則是新東方考研在AI批改之外的另一大核心應(yīng)用。

  在練習(xí)和測評方面,針對考研真題量少的痛點,新東方不僅建立起豐富的數(shù)字題庫,支持高頻次練習(xí)和測試,還結(jié)合歷年真題大數(shù)據(jù)及人工校驗,研發(fā)了AI大模型賦能的自生產(chǎn)題目系統(tǒng),可以根據(jù)學(xué)科核心知識點和考察難度自動生成模擬題。

  所謂AI題目生成功能,是指考研真題量少,如果學(xué)生需要大量練習(xí),就需要考研老師修改真題并產(chǎn)出模擬題。如今老師修改真題的過程可以被AI借鑒、由AI生題。

  但如何保證AI生成的考研模擬題的質(zhì)量?對此,洪喆表示,AI出題后會有驗證環(huán)節(jié),首先基于歷年真題庫的喂養(yǎng),再加上老師人工校驗(每位老師一道題一道題地做,做完之后再一道題一道題地錄,再進(jìn)行二次人工修改,同時針對知識點打標(biāo)簽)。

  團(tuán)隊以題庫較少的醫(yī)綜為例進(jìn)行測試,發(fā)現(xiàn)AI生成題目的可用度接近100%,而且,AI第一批次直接生成的題量是4000道題,可以完全匹配到整個西醫(yī)綜合的6000個核心知識點,AI出題后,可以節(jié)約90%的人效。

  接下來,新東方考研還會布局哪些AI應(yīng)用?

  袁榮透露:“未來一段時間,我們核心要做的是把 AI 的能力嵌入到學(xué)員整個學(xué)習(xí)旅程的各個階段。讓老師跟系統(tǒng)相互配合,形成良性有效的循環(huán)。”

  更遠(yuǎn)的未來,袁榮認(rèn)為:“從整個學(xué)習(xí)的角度來看,最核心的是,讓教學(xué)或系統(tǒng)跟著學(xué)生的能力和節(jié)奏走,而不是讓學(xué)生跟著我們的教學(xué)或者系統(tǒng)能力走。這可能是教育的一個大的方向。我們所有的努力都是讓這件事情跟學(xué)生的貼合度更高一些,讓學(xué)生在這個過程中更舒適、更有效,同時取得更好的效果。”

  可以看到,當(dāng)前,新東方考研的AI功能核心是面向老師提供服務(wù)。“本著嚴(yán)謹(jǐn)?shù)慕嵌?,初期階段,我們所有AI能力一定會通過老師這個端口對最終結(jié)果進(jìn)行把控。”

  團(tuán)隊也明確表示,目前暫不考慮研發(fā)單獨的C端AI應(yīng)用。“一方面,純粹的C端應(yīng)用提供的服務(wù)目前沒有老師提供的解決方案好。另一方面,只有在內(nèi)部的嚴(yán)肅應(yīng)用中進(jìn)行充分驗證,同時交給外部用戶也產(chǎn)生一些社會價值時,我們才會考慮做服務(wù)于外部用戶的C端應(yīng)用。”袁榮解釋道。

  02

  打通系統(tǒng)和人的配合是最大挑戰(zhàn)

  據(jù)新東方大學(xué)生學(xué)習(xí)與發(fā)展中心考研項目總監(jiān)李琳透露,研發(fā)AI教育產(chǎn)品,真正的卡點并非是技術(shù),而是如何在提升老師的效率、同時讓學(xué)生很滿意的情況下,打通系統(tǒng)和人的配合,串聯(lián)起整個鏈條的所有動作。

  李琳強(qiáng)調(diào),不能過分地放大技術(shù)本身的力量,還要考慮學(xué)生對老師提供陪伴的需求。“研發(fā)AI功能不是為了取代人,而是去幫助人,讓人有更多精力去做更重要的事,比如進(jìn)行針對性的解析和指導(dǎo)、提供鼓勵和支持等等。”

  李琳舉了個例子。臨近2025考研初試的這段日子,新東方考研的??枷到y(tǒng)首次面向各個城市分中心落地應(yīng)用,幾乎每天,都有分中心在組織模考。“我們團(tuán)隊此前思考的一直都是如何提升??枷到y(tǒng)批改的準(zhǔn)確度。但實際上,學(xué)員們在??辑h(huán)節(jié)面臨的問題,往往是條形碼怎么貼、老師在AI批改后給準(zhǔn)確反饋的時效是多久……在打通系統(tǒng)和人的配合這件事上,我們反而花了2/3的精力。”

  03

  AI如何助力提質(zhì)增效?

  談及AI應(yīng)用的降本增效,洪喆透露:“過去,老師批改完一張??荚嚲泶蠹s需要10分鐘,現(xiàn)在人與系統(tǒng)協(xié)作僅需約2分鐘就能完成,極大提升了批改的效率和準(zhǔn)確度。”

  “之前一名老師一天只能批改 30 份試卷左右,現(xiàn)在一個老師一天可以看 200-300 道題,批改環(huán)節(jié)可以節(jié)約90%的人效。而批改之后給學(xué)生的解析是由人(老師)來進(jìn)行的。如果在批改環(huán)節(jié)可以節(jié)省老師的時間,就可以幫助老師在解析、在面對面答疑等部分投入更多精力。”洪喆說道。

  “不過,新東方并沒有因為人效提高而縮減人力成本,而是優(yōu)化了教育的資源配置。” 李琳進(jìn)一步舉例道, “如果之前只能組織3次??迹窃贏I提效的情況下,我們就可以組織10次??肌?rdquo;

  04

  “鴻蒙最吸引我們的,是它的整個生態(tài)和對于萬物互聯(lián)的開放性”

  為什么要上線鴻蒙原生版App?

  從用戶需求來看,用戶對鴻蒙版App的期待程度超過了團(tuán)隊的預(yù)期。

  洪喆透露,本來新東方考研并不準(zhǔn)備如此早地切入到鴻蒙生態(tài)中,但隨著越來越多的學(xué)生升級鴻蒙系統(tǒng)、使用鴻蒙的設(shè)備,原來的安卓版App無法使用,因此,不少學(xué)員會咨詢鴻蒙版本App的上線時間。

  自2023年年初開始,新東方考研正式立項研發(fā)鴻蒙版App。新東方在線也是首批鴻蒙教育類App。“一開始我們并不準(zhǔn)備把鴻蒙做得很重,但是上架了1.0版本之后,來自鴻蒙平臺的用戶的積極反饋是遠(yuǎn)高于其他平臺的。這也表明學(xué)員更加認(rèn)可鴻蒙版App,所以我們今年追加了將近200名員工投入到鴻蒙版App的研發(fā)。”洪喆說道。在關(guān)鍵的開發(fā)階段,華為的工程師也駐場輔助開發(fā)。

  從鴻蒙系統(tǒng)本身來看,在國際科技競爭日益加劇的背景下,推出具有國際競爭力的操作系統(tǒng)是中國科技自主創(chuàng)新的關(guān)鍵一步,而鴻蒙作為國產(chǎn)操作系統(tǒng)的代表,具有重要意義。

  更重要的是,鴻蒙頗具生態(tài)潛力。袁榮補(bǔ)充道:“鴻蒙最吸引我們的,是它的整個生態(tài)和對于萬物互聯(lián)的開放性,這也是鴻蒙釋放更大潛力的地方,其突出的核心能力有兩點:

  第一點是多平臺的協(xié)同,鴻蒙系統(tǒng)基本上可以面向未來各種類型的終端和生態(tài)。今天是手機(jī)電視pad,明天可能是VR眼鏡和其它可穿戴設(shè)備。

  第二點是鴻蒙系統(tǒng)有很強(qiáng)的AI原生能力。這意味著,過去是在服務(wù)端提供AI能力,現(xiàn)在是終端提供AI支持能力,這為我們未來的應(yīng)用提供了很多空間。”

  05

  考研市場格局“梯形”化

  大浪淘沙后,李琳認(rèn)為,從考研品牌的市場份額來看,如果說以前呈倒三角形分布(全國性的品牌的直營的機(jī)構(gòu)占的市場份額占比較大),現(xiàn)在則呈現(xiàn)梯形分布,腰部機(jī)構(gòu)增長勢頭良好。所謂“腰部機(jī)構(gòu)”,是指在考研細(xì)分領(lǐng)域?qū)用姹憩F(xiàn)出色的一些考研機(jī)構(gòu)。

  “在滿足需求層面,考研機(jī)構(gòu)能有差異化的競爭優(yōu)勢,是保證其存活下來的重要因素之一。當(dāng)然,如果在垂域扎得比較深,就必須考慮考試政策發(fā)生變化(比如換大綱、換教材、某個考試環(huán)節(jié)取消等)的潛在風(fēng)險,這也倒逼考研機(jī)構(gòu)必須提前進(jìn)行中長期布局。”

  關(guān)于考研培訓(xùn)的整體市場份額,李琳認(rèn)為,盡管近幾年來,課程培訓(xùn)類產(chǎn)品的市場份額在縮減,但仍有大量的需求場景尚未被完全開發(fā),比如擇校規(guī)劃答疑產(chǎn)品/服務(wù)、出版物等,這也是機(jī)會所在。

  相關(guān)閱讀:

  新東方擁抱AI:大學(xué)事業(yè)部如何應(yīng)用大模型?