優(yōu)編程已實(shí)現(xiàn)盈利。

朱宇投身信奧編程:我為什么要做信奧領(lǐng)域垂直大模型?

2024-08-09 09:14:50發(fā)布     來源:多知    作者:徐晶晶  

  來源|多知

  作者|徐晶晶

  2021年底,告別東方優(yōu)播后,朱宇便在新東方的支持下,啟動(dòng)再次創(chuàng)業(yè),創(chuàng)辦優(yōu)編程。在大涼山支教完回京后,他帶著優(yōu)編程步入正軌。

  此前,朱宇曾歷任新東方北京學(xué)校校長助理、東方優(yōu)播CEO。東方優(yōu)播曾在五年內(nèi)實(shí)現(xiàn)營收從零到8億元的跨越。

  當(dāng)下,優(yōu)編程已實(shí)現(xiàn)盈利,2023年?duì)I收超過2000萬元。

  從線上拓展到了線下,是優(yōu)編程過去一年來的顯著變化之一。再過一個(gè)月,優(yōu)編程的旗艦店——公主墳校區(qū)將正式開業(yè),這也是優(yōu)編程在理想大廈校區(qū)外的第二所線下校區(qū)。

  優(yōu)編程聚焦的是信奧領(lǐng)域(全稱“全國青少年信息學(xué)奧林匹克競賽”,National Olympiad in Informatics,簡稱NOI)),并與悉之智能合作研發(fā)了“優(yōu)香農(nóng)大模型”,采用AI老師講題模式。作為立足于信息學(xué)編程領(lǐng)域的垂直大模型,優(yōu)香農(nóng)大模型當(dāng)前處于開放內(nèi)測階段。

  為什么這一次創(chuàng)業(yè)選擇信奧領(lǐng)域?為什么選擇用AI老師解決信奧答疑問題?

  近日,朱宇向多知分享了他的思考。

  01

  信奧領(lǐng)域?yàn)槭裁葱枰怪贝竽P?

  當(dāng)前,信奧領(lǐng)域市場蓬勃發(fā)展,但一個(gè)明顯的制約因素是,信奧對師資的要求很高,因而師資供給匱乏。

  據(jù)優(yōu)編程內(nèi)部測算,在供給端,全國的編程類老師和教練共有20萬,其中真正理解算法的老師更少。而在需求端,國內(nèi)有編程需求的學(xué)生接近2000萬,按10%的滲透率估算,大概需要200萬名教練。

  那么,大模型能否頂上呢?

  從技術(shù)方面來看,有一定的可行性。

  盡管大模型存在幻覺問題,但用大模型解決信息學(xué)問題的精準(zhǔn)度要高于其他學(xué)科。這是因?yàn)?,互?lián)網(wǎng)上的開源信奧題有很多,信奧題的答題過程是線上化的(寫完代碼需要測試運(yùn)行,必須在線上進(jìn)行),這意味著,信奧領(lǐng)域能用于訓(xùn)練大模型的數(shù)據(jù)多,大模型給信奧帶來實(shí)際價(jià)值的可能性也更大。

  “技術(shù)處于發(fā)展期時(shí),所有構(gòu)想的實(shí)現(xiàn)其實(shí)都取決于成本和代價(jià)。當(dāng)下,受限于算力、算法、數(shù)據(jù)、場景,大模型的成本還很高。當(dāng)算力、算法、數(shù)據(jù)還并不給力時(shí),選擇一個(gè)合適的商業(yè)場景就很重要了。”朱宇說道。

  朱宇找到的信奧學(xué)習(xí)關(guān)鍵性場景、大模型的切入口是幫學(xué)生答疑/debug。“很多學(xué)生信奧學(xué)不下去是因?yàn)?,課后在自己編寫代碼時(shí),碰到問題,往往沒有老師立刻指導(dǎo)。這時(shí),如果能有一個(gè)AI老師出現(xiàn)解決痛點(diǎn),這種方式也能更低成本、大規(guī)模地推廣起來。”

  在信奧編程學(xué)習(xí)場景下,優(yōu)香農(nóng)大模型究竟能做什么?

  據(jù)介紹,優(yōu)香農(nóng)大模型具備給學(xué)生講解信奧題、答疑的能力。

  當(dāng)用戶輸入一道信奧題時(shí),大模型會(huì)先生成題解(思路+Code)。當(dāng)遇到不懂之處時(shí),AI老師會(huì)進(jìn)行多模態(tài)交互講解。

  有了優(yōu)香農(nóng)的AI老師后,在沒有老師指導(dǎo)的情況下,學(xué)生要想找出代碼的bug,就可以先把信奧題目和代碼粘貼進(jìn)優(yōu)香農(nóng),得到AI老師的講解。

  對于老師來說,優(yōu)香農(nóng)也是一個(gè)趁手的提升效率的工具。對信奧老師而言,給學(xué)生講題、看代碼是一件耗時(shí)耗力的工作,有了AI老師,可以極大提升答疑效率。

  朱宇透露,在AI老師出現(xiàn)前,老師一個(gè)晚上最多能夠服務(wù) 10 個(gè)學(xué)生,而現(xiàn)在借助優(yōu)香農(nóng),一個(gè)老師一晚上服務(wù)的學(xué)生數(shù)可能達(dá)到30個(gè)。

  另一個(gè)判斷優(yōu)香農(nóng)大模型解題能力的數(shù)據(jù)是,在CSP-J/S題目上,其擁有近90%解題率(OJ通過率),遠(yuǎn)高于市面上的主流模型。且當(dāng)前市面上主流模型的代碼能力準(zhǔn)確率并不高,更偏向于解決實(shí)際業(yè)務(wù)問題、面向?qū)I(yè)程序員,回答風(fēng)格傾向于使用專業(yè)名詞解釋代碼,并不適配教學(xué)場景。

  

  關(guān)于優(yōu)香農(nóng)大模型底層的技術(shù)原理,優(yōu)編程的合作方悉之智能創(chuàng)始人孫一喬回憶了雙方兩年來的合作歷程:

  首先,雙方構(gòu)建了基于信奧編程教學(xué)的完整知識體系下的數(shù)千知識點(diǎn),并將其開發(fā)為可以供模型調(diào)用的KAS節(jié)點(diǎn),讓其成為了模型最有力的解題支持和工具。

  其次,在教學(xué)過程中,雙方一起開發(fā)信奧的學(xué)科體系。比如信奧里有一種“分治法”,要把它開發(fā)成大模型可以調(diào)用的方法。

  第三,引入優(yōu)編程的優(yōu)秀教練的教學(xué)方式,來訓(xùn)練模型,讓AI能夠真正像信奧編程教練一樣講題。通過在實(shí)際教學(xué)中積累的海量解題、講解素材,對模型基座進(jìn)行了進(jìn)一步的SFT和強(qiáng)化學(xué)習(xí),讓其使用Muiti-Agent的思路進(jìn)行推理,并學(xué)會(huì)真人名師教練的拆解題目、分析思路、講解風(fēng)格。并且針對信奧賽道進(jìn)行大量的對齊和指令優(yōu)化,讓其輸出更遵循信奧教學(xué)準(zhǔn)則。

  02

  開放優(yōu)香農(nóng)

  朱宇認(rèn)為,優(yōu)香農(nóng)大模型達(dá)到了商業(yè)級應(yīng)用的標(biāo)準(zhǔn)。

  孫一喬認(rèn)為,優(yōu)香農(nóng)大模型讓整個(gè)信息學(xué)編程行業(yè)出現(xiàn)供給端改革的可能。

  不過,朱宇坦陳,當(dāng)前,優(yōu)香農(nóng)的AI老師可以做好每一道信奧題的答疑,可以解放老師的部分工作,但并不能完全代替主講老師的工作。“讓它單獨(dú)的講題是沒有問題的,但真正的課堂不只是一道題,還涉及到學(xué)生的知識背景等,非常復(fù)雜。”

  據(jù)朱宇介紹,接下來,優(yōu)香農(nóng)大模型會(huì)進(jìn)行兩個(gè)方向的迭代:

  其一,將推出更多簡便易上手的功能。

  例如,當(dāng)借助優(yōu)香農(nóng)給自己的代碼debug時(shí),學(xué)員目前的操作路徑分為兩步,先粘貼題目,再粘貼自己寫的代碼。對比真人老師幫找bug,這已經(jīng)是一種很高效的debug方式了,不過,省去“粘貼題目”這一環(huán),直接粘貼代碼、一步到位得到指點(diǎn),是優(yōu)香農(nóng)未來要努力實(shí)現(xiàn)的。這在用戶體驗(yàn)上也得到了極大提升。

  再比如,優(yōu)編程也在籌備出版信息學(xué)教輔。“未來的教輔就是AI教輔。”朱宇說道。從用戶體驗(yàn)來看,用系統(tǒng)自動(dòng)給書里的每道題配講解視頻后,學(xué)生掃碼就能看到講解,還可以繼續(xù)提問。對企業(yè)來說,制作成本要比人工錄制視頻講解題目低得多。

  其二,將完善B端的系統(tǒng)功能。

  優(yōu)香農(nóng)的用戶有三種:學(xué)員、家長及老師。當(dāng)前,除了要考慮學(xué)生和家長端的需求外,優(yōu)香農(nóng)面向老師的功能也將不斷完善。

  如果要讓老師更好地利用優(yōu)香農(nóng),則要符合老師的需求,和學(xué)情系統(tǒng)結(jié)合。比如不需要導(dǎo)入數(shù)據(jù)分析,系統(tǒng)就能自動(dòng)分析學(xué)生學(xué)情。

  如前文所說,優(yōu)香農(nóng)大模型帶來信奧領(lǐng)域的師資供給端改革。那么未來,優(yōu)編程是否會(huì)開放給行業(yè)機(jī)構(gòu)、學(xué)校等?

  朱宇表示,當(dāng)前優(yōu)香農(nóng)還在測試階段,未來也希望其能令全社會(huì)受益。“技術(shù)不斷發(fā)展,在很多事情上無非就是時(shí)間早晚的問題。我們會(huì)存在一個(gè)領(lǐng)先期,但就發(fā)展規(guī)律上而言,只要有精力、有時(shí)間、有金錢投入,別人想做這件事,最終有一天也是有可能追得上來的。優(yōu)香農(nóng)如果能幫助國內(nèi)編程領(lǐng)域、算法學(xué)習(xí)領(lǐng)域取得更好的發(fā)展,我們肯定是很樂意的,也歡迎大家一起探討怎么使用它。”

  03

  AI時(shí)代來臨,“信奧代表未來”

  “做優(yōu)編程并非是突發(fā)奇想,我已經(jīng)思考了兩年多,且有一套比較清晰的定位和清晰的策略推進(jìn)這件事情。”朱宇說。

  為什么堅(jiān)定選擇信奧領(lǐng)域?

  朱宇分析了三方面因素:

  其一,AI時(shí)代來臨,學(xué)信奧,愈發(fā)重要。

  朱宇提到,工業(yè)革命對教育產(chǎn)生的最大影響就是把深層次的科學(xué)理論變成人人都要學(xué)的內(nèi)容(不同于傳統(tǒng)師徒制下傳承的是各類具體的傳統(tǒng)技術(shù))。只有學(xué)習(xí)了這些理論之后,人才能夠成為機(jī)器的主人。

  而人工智能革命對教育帶來的影響是,基礎(chǔ)性的編程在人工智能時(shí)代或?qū)⒌玫狡占盎?ldquo;基礎(chǔ)編程可能本身不重要,但是編程背后的算法、數(shù)據(jù)結(jié)構(gòu)、信息學(xué)原理變得更重要了。”時(shí)代的需求使得家長意識到孩子要學(xué)信奧,不僅是簡單的學(xué)編程,更要學(xué)背后的算法原理。

  其二,在全球競爭格局下,對高科技人才(含信奧領(lǐng)域人才)培養(yǎng)的需要。

  其三,學(xué)編程可提升孩子的能力素養(yǎng)。

  朱宇分析:

  “各科目對孩子能力的考察可分為兩類:第一類是結(jié)果性輸出。第二類是過程性輸出,比如語文和英語的作文側(cè)重對感性能力的訓(xùn)練。物理和化學(xué)的實(shí)驗(yàn)雖然是培養(yǎng)理性能力的過程性輸出考察,但限于場地、實(shí)驗(yàn)器具等。

  而編程是一個(gè)可以低成本進(jìn)行邏輯思維能力的過程性考察的品類,它輸出的程序是個(gè)過程,孩子們寫的代碼也有明確的迭代空間(迭代指標(biāo)明確,代碼量、行數(shù)、空間存儲(chǔ)量、程序耗時(shí)等)。”

  當(dāng)前,信奧市場規(guī)模在急劇增長。

  朱宇粗略判斷,興趣類的編程(主要學(xué)圖形化編程,不涉及有難度的算法內(nèi)容)是 400 億的市場規(guī)模,信奧的規(guī)模目前只有興趣類規(guī)模的 1/ 10。但信奧市場每年以70%的增速增長,預(yù)計(jì)未來三到五年,信奧市場規(guī)模能夠超過 100 億。

  就市場格局而言,多年來,信奧行業(yè)囿于小眾垂直,業(yè)態(tài)格局高度分散,“學(xué)信奧的學(xué)生有八成是跟著個(gè)體老師或者學(xué)校的教練在學(xué),類似于新東方創(chuàng)立之前的英語培訓(xùn)市場。”

  “現(xiàn)在各個(gè)選手都在起跑階段。隨著需求不斷增加和有規(guī)?;\(yùn)作經(jīng)驗(yàn)的參與者不斷入局,信奧領(lǐng)域會(huì)逐漸形成有如新東方成立后的英語培訓(xùn)市場格局,跑出龍頭機(jī)構(gòu)。”朱宇判斷。

  朱宇向多知透露,2023年優(yōu)編程年?duì)I收超過2000萬元。當(dāng)下,優(yōu)編程已實(shí)現(xiàn)盈利,單季度學(xué)員超過2000人次。

  04

  “教育產(chǎn)品的四個(gè)組成部分,都有很強(qiáng)的個(gè)性化訴求”

  “現(xiàn)在的AI,有可能實(shí)現(xiàn)過去3000年來技術(shù)革命都沒有做到的事情——讓教育實(shí)現(xiàn)個(gè)性化。”朱宇判斷。

  雙方合作之初,當(dāng)孫一喬問朱宇心中理想狀態(tài)下的個(gè)性化AI教育產(chǎn)品長什么樣子時(shí),朱宇洋洋灑灑,拋出了一個(gè)非常理想化的愿景:

  在大模型廣泛使用之前,過往的技術(shù)無法批量化生產(chǎn)教育的個(gè)性化產(chǎn)品。

  在此之前,教育產(chǎn)品一直處于一個(gè)不可能三角:低成本、大規(guī)模和高質(zhì)量,在教育上不可能同時(shí)達(dá)成。

  而現(xiàn)在的AI,有可能打破這個(gè)不可能三角,實(shí)現(xiàn)過去3000年技術(shù)革命都沒有做到的事情——讓教育實(shí)現(xiàn)個(gè)性化。

  細(xì)分來說,教育產(chǎn)品的四個(gè)組成部分,都有很強(qiáng)的個(gè)性化訴求。

  第一,課程知識。課程內(nèi)容要做到個(gè)性化的,要滿足學(xué)生水平、興趣、背景。

  第二,課堂體驗(yàn)。不同的孩子對于課堂風(fēng)格的要求也不一樣,如果可以借用某個(gè)導(dǎo)師的形象生成虛擬教師,按照學(xué)生要求賦予他不同的風(fēng)格,以不同的語言、語調(diào)、神態(tài)和授課方式給學(xué)生呈現(xiàn),就能夠發(fā)揮生成式AI的特性來讓孩子調(diào)動(dòng)他最大的積極性來去學(xué)習(xí)。

  第三,課后管理。包括個(gè)性化地推送作業(yè)。要達(dá)成高效的學(xué)習(xí)效果,盲目刷題不可取,而是讓孩子做自己恰好不太懂的內(nèi)容。大模型既可以學(xué)習(xí)廣泛的經(jīng)驗(yàn),又可以了解這個(gè)孩子過往的學(xué)習(xí)經(jīng)歷,就可以推送更適合這個(gè)孩子的學(xué)習(xí)路徑。

  第四,教育理念。AI不僅能在家長的價(jià)值觀基礎(chǔ)上生成三觀一致的AI老師,還可以告訴家長現(xiàn)在先進(jìn)的認(rèn)知方向、教育理念以影響家長。

  技術(shù)派孫一喬聽完表示,這樣的構(gòu)想太過遙遠(yuǎn),當(dāng)下難以落地。但他也愿意和朱宇一起探索。

  畢竟,誰又能拒絕走向這樣的未來呢?

  相關(guān)閱讀:

  解題出海產(chǎn)品競爭紅?;?,TutorEva憑什么收獲200萬用戶?

  瞄準(zhǔn)信息學(xué)競賽教育,朱宇要帶新東方優(yōu)編程走向何方?

  朱宇:我在大涼山支教這半年,那些理想、現(xiàn)實(shí)、困難、改變