“一邊做,一邊等風(fēng)來?!?/p>

洋蔥學(xué)園首次披露“智能學(xué)伴”:自適應(yīng)學(xué)習(xí)、AI答疑,還有情感陪伴

2024-06-25 16:46:43發(fā)布     來源:多知    作者:林健  

  來源|多知OpenTalk

  整理|徐晶晶

  攝|張蔚斐

  近日,在多知OpenTalk第45期“AI如何引領(lǐng)教育走向新紀(jì)元”活動上,洋蔥學(xué)園App的產(chǎn)品負(fù)責(zé)人林健分享了產(chǎn)品與AI結(jié)合的思考與探索。

  這是洋蔥學(xué)園第一次系統(tǒng)性地對外披露其打造“AI智能學(xué)伴”的底層思考邏輯。

  林健表示,關(guān)于AI賦能教育,洋蔥學(xué)園有兩個基礎(chǔ)認(rèn)知:

  1.“匹配用戶真實使用場景和核心痛點的體驗設(shè)計” 是1,“疾速發(fā)展的AI技術(shù)”是將價值放大的0。

  2.優(yōu)質(zhì)的內(nèi)容永遠是洋蔥學(xué)園最重要的核心資產(chǎn)。

  基于上述兩個基礎(chǔ)認(rèn)知,洋蔥在服務(wù)學(xué)生和家長時,在自適應(yīng)學(xué)習(xí)、學(xué)習(xí)規(guī)劃、答疑、判主觀題等環(huán)節(jié)都進行了AI探索。

  在學(xué)習(xí)場景外,洋蔥學(xué)園還關(guān)注到孩子的心理健康場景——推出了“暖暖AI”產(chǎn)品功能,使洋蔥學(xué)園App成為也能提供情緒價值的“成長伙伴”。

  以下為林健分享原文(經(jīng)多知編輯):

  大家好!我是洋蔥學(xué)園App的產(chǎn)品負(fù)責(zé)人林健,是一名設(shè)計師背景的產(chǎn)品經(jīng)理,也是重度的AI應(yīng)用愛好者,有比較豐富的服務(wù)設(shè)計和產(chǎn)品設(shè)計的經(jīng)歷。首先我來簡單介紹下洋蔥學(xué)園這家公司。

  洋蔥學(xué)園創(chuàng)建于2013年,創(chuàng)始團隊的核心成員大多來自“陽光書屋”,這是一個聚焦鄉(xiāng)村信息化教育的公益組織。成立之初,公司推出了“洋蔥數(shù)學(xué)App”,結(jié)合優(yōu)質(zhì)課程內(nèi)容與人機交互能力為學(xué)生提供更好的學(xué)習(xí)體驗。

  之后,洋蔥快速發(fā)展,推出不同學(xué)段、不同學(xué)科的課程,學(xué)習(xí)場景也不斷拓寬,更名為“洋蔥學(xué)園”。到今天,洋蔥學(xué)園已經(jīng)成為一家教育科技集團化公司,涉足8條業(yè)務(wù)線:數(shù)字資源、智能學(xué)伴、智能硬件、基礎(chǔ)教育數(shù)字化、職業(yè)教育數(shù)字化、教育公益、融合出版和研學(xué)實踐教育。

  

  洋蔥學(xué)園集團旗下運營5個子品牌,分別是洋蔥學(xué)園App、洋蔥學(xué)園教師版、洋蔥星球、洋蔥智課和洋蔥助教行動。

  

  過去10年,洋蔥學(xué)園累計的學(xué)生用戶超過1.1億名,全國已經(jīng)有三分之一的中小學(xué)生成為了洋蔥學(xué)園的“蔥粉”;公立校教師用戶超過336萬名。目前,洋蔥自主研發(fā)了超過8000部數(shù)字課程,學(xué)生的自主學(xué)習(xí)時長超過1.6億小時,學(xué)習(xí)行為數(shù)據(jù)超過4343億條。洋蔥學(xué)園積累的用戶數(shù)據(jù),是做AI賦能教育時非常關(guān)鍵的因素。

  01

  兩個基礎(chǔ)認(rèn)知:“先教育,后AI”

  隨著AIGC浪潮的到來,我們做產(chǎn)品時也會有些焦慮:一定要快速地把AI用在產(chǎn)品上、讓用戶和場景都被AI賦能嗎?如果是,具體應(yīng)該怎么做?

  我們希望把洋蔥學(xué)園打造為學(xué)生的AI智能學(xué)伴,給用戶提供更具伙伴感的使用體驗。對于AI賦能教育,洋蔥學(xué)園有兩個基礎(chǔ)認(rèn)知。洋蔥后續(xù)的決策和動作,都會基于這兩個基礎(chǔ)認(rèn)知進行拆解。

  第一個基礎(chǔ)認(rèn)知是,“匹配用戶真實使用場景和核心痛點的體驗設(shè)計” 是1,“疾速發(fā)展的AI技術(shù)”是將價值放大的0。

  我們希望盡可能簡單和專注,讓新技術(shù)自然地和用戶學(xué)習(xí)場景以及最真實的需求相結(jié)合。在我們看來,新的技術(shù)出現(xiàn)時會讓用戶感到非常新鮮,但要想讓用戶堅持使用并且獲得個人成長,就一定得找出精準(zhǔn)的目標(biāo)用戶是誰,并識別出他們的真實訴求。

  第二個基礎(chǔ)認(rèn)知是,優(yōu)質(zhì)的內(nèi)容本身永遠是洋蔥學(xué)園最重要的核心資產(chǎn)。

  洋蔥學(xué)園的課程內(nèi)容生產(chǎn)成本很高。一節(jié)5到8分鐘的數(shù)字課程,平均研發(fā)和打磨歷時至少2個月。高質(zhì)量的內(nèi)容也是洋蔥學(xué)園創(chuàng)立至今被用戶高度認(rèn)可的基石。

  基于這兩個基礎(chǔ)認(rèn)知,洋蔥學(xué)園目前都做了哪些結(jié)合AI的探索和嘗試?在C端,我們服務(wù)的對象包括學(xué)生和家長,從服務(wù)對象出發(fā),洋蔥學(xué)園分別能做什么?

  02

  一個目標(biāo):AI,讓孩子學(xué)會“自主學(xué)習(xí)”

  面向?qū)W生,我們致力于將洋蔥學(xué)園打造為AI智能學(xué)伴。

  我們思考的問題是,是用AI能力為學(xué)生創(chuàng)造新的學(xué)習(xí)場景或?qū)W習(xí)能力,還是將AI能力嵌入學(xué)生已有的學(xué)習(xí)流程、助力現(xiàn)有的學(xué)習(xí)場景?

  市場上很多產(chǎn)品都提供了幫助學(xué)生總結(jié)課程重點、生產(chǎn)學(xué)科素材、進行作文批改等能力。類似的功能,洋蔥也在做,因為這些功能幫助學(xué)生以更便捷的方式、更低廉的成本獲得學(xué)習(xí)內(nèi)容。

  但,這類功能是不是AI賦能教育里最有價值的探索?

  我們認(rèn)為,類似的功能和場景一定很有價值,但仍是“授人以魚”,我們想在這個基礎(chǔ)上做更多的探索。為學(xué)生創(chuàng)造新的學(xué)習(xí)場景或者學(xué)習(xí)能力,并不是最能夠彰顯AI能力價值的點。因為AI工具其實是一種“新”的交付方式,但是否是“更好”的交付方式則完全取決于背后將技術(shù)產(chǎn)品化的教育者。例如當(dāng)涉及到文章批改、總結(jié)等,AI在經(jīng)過精心設(shè)計的prompt和工作流的基礎(chǔ)上,可能可以做到以較高的水平給到用戶一些建議,但是要提升交付的質(zhì)量和可用性,背后少不了有經(jīng)驗的教育者參與。

  那么,在嵌入學(xué)生已有的學(xué)習(xí)流程、助力現(xiàn)有的學(xué)習(xí)場景方面,洋蔥學(xué)園有哪些嘗試?

  

  首先,洋蔥學(xué)園將AI能力嵌入已有的核心學(xué)習(xí)流程的重要探索之一是自適應(yīng)學(xué)習(xí)。這個功能叫“洋蔥AI精準(zhǔn)學(xué)”,通過將用戶真實的學(xué)情和知識圖譜融合呈現(xiàn),幫助不知如何學(xué)的用戶快速上手,并取得較好的學(xué)習(xí)效果。

  早在2017年,洋蔥學(xué)園就已經(jīng)開始對自適應(yīng)學(xué)習(xí)進行探索了,對洋蔥的課程做了細致的切片,在課程中加入一些交互分支,讓學(xué)生可以反復(fù)學(xué)習(xí)薄弱的知識點片段,或者匹配到更適合自己當(dāng)前學(xué)習(xí)難度的片段等。

  今天,洋蔥學(xué)園已經(jīng)能夠非常精準(zhǔn)地為每位用戶推送適合的學(xué)習(xí)內(nèi)容。基于龐大的用戶基數(shù)和學(xué)習(xí)行為數(shù)據(jù),我們?yōu)樗姓n程內(nèi)容、習(xí)題和講義打了科學(xué)系統(tǒng)的標(biāo)簽,再加上AI能力的加持,確保用戶學(xué)到的是適合他的內(nèi)容。

  當(dāng)前,我們已經(jīng)能夠在用戶學(xué)習(xí)數(shù)據(jù)比較少的情況下,評估某一道題用戶做對做錯的概率,準(zhǔn)確率已超過70%。對于用戶來說,整個學(xué)習(xí)體驗就會非常好,能夠讓他集中精力學(xué)習(xí)相對薄弱的地方。

  學(xué)生在學(xué)習(xí)這些內(nèi)容時,既能夠感受到挑戰(zhàn),激發(fā)思考,又不會感覺過難、產(chǎn)生挫敗感。這樣的學(xué)習(xí)體驗可以不斷調(diào)動學(xué)習(xí)積極性,讓學(xué)生更容易堅持下去。

  與此同時,我們的學(xué)習(xí)數(shù)據(jù)不斷積累,基于數(shù)據(jù)反饋,課程研發(fā)也能不斷優(yōu)化,給習(xí)題和講義打的標(biāo)簽更加精準(zhǔn),進而算法也更加精準(zhǔn),最終形成正向的循環(huán)。

  其次,我們還做了很多關(guān)于學(xué)習(xí)規(guī)劃的探索。

  

  通過對用戶的調(diào)研,我們發(fā)現(xiàn),很多學(xué)生的學(xué)習(xí)效果不理想,是因為他們不知道如何開始學(xué)習(xí)。

  為了解決這個問題,洋蔥學(xué)園基于不同的用戶分層、真實需求痛點,為他們制定各種學(xué)習(xí)計劃。比如針對中高考備考,我們會采集真實性的訴求,比如學(xué)生當(dāng)下的能力水平是怎樣的、希望最終達到什么樣的水平以及能投入多長時間學(xué)習(xí),然后結(jié)合課程研發(fā)能力、AI能力,給用戶制定學(xué)習(xí)規(guī)劃。

  第三,洋蔥學(xué)園還做了用AI賦能答疑、判主觀題的探索。

  洋蔥學(xué)園有一個功能板塊叫“去答疑”?;谡n程內(nèi)容的答疑和追問,也是一個AI可以大有所為的方向。

  在這個方面,通過將完整的課程內(nèi)容、學(xué)生原本的提問和提問所關(guān)聯(lián)課程的具體時間點等信息結(jié)合,再加上專業(yè)的教研老師和產(chǎn)品共同討論設(shè)計prompt,以適當(dāng)?shù)墓ぷ髁鬟M行處理,我們可以為用戶提供更加及時的答疑服務(wù)。

  還有很多用戶聽完一節(jié)課之后,會問到?jīng)]有出現(xiàn)在課程中的相關(guān)題目,我們也會在答疑環(huán)節(jié)進行講解。

  洋蔥學(xué)園課程設(shè)計的思路一直是,當(dāng)用戶提出一個問題后,我們并不會直接給他答案,而是引導(dǎo)他思考題目中可能會用到哪些知識點,以什么樣的思路一步步把題目解出來。這方面,我們也對AI進行了大量的預(yù)訓(xùn)練和調(diào)校,讓它能夠給到用戶相對可靠的講解,尤其在偏文科或者低年級理科上都取得了不錯的效果。這也在很大程度上節(jié)省了洋蔥在答疑方面的人力投入。

  學(xué)生使用在線教育產(chǎn)品學(xué)習(xí)的過程中還有一個常見痛點,就是有很多“主觀題”,這些題目沒有標(biāo)準(zhǔn)答案,往往是通過判斷學(xué)生的作答中是否包含了一些“得分點”或符合題目要求的表達等來進行給分。因此在類似刷題練習(xí)或模擬測試場景中,用戶的體驗并不理想。經(jīng)常是在完成作答后,將標(biāo)準(zhǔn)答案和題目解析給到用戶,需要用戶自行判斷是否作答正確。

  而這個場景下需要的正好是大語言模型比較擅長的能力,通過合適的prompt工程和工作流設(shè)計,洋蔥學(xué)園研發(fā)了AI判主觀題的功能。用戶在主觀題作答場景可以節(jié)省寶貴的學(xué)習(xí)時間,學(xué)習(xí)體驗也會得到顯著的提升。

  自適應(yīng)學(xué)習(xí)、做學(xué)習(xí)規(guī)劃、給用戶答疑以及主觀題判題包括進一步講解,這些是洋蔥學(xué)園產(chǎn)品團隊在進行產(chǎn)品迭代時,把AI能力嵌入學(xué)生現(xiàn)有學(xué)習(xí)場景并為之賦能的一些探索。通過融入這些場景,可以讓用戶更加沒有感知、更加自然地受益于AI能力的發(fā)展,在學(xué)習(xí)過程中取得更好的效果。這也是洋蔥學(xué)園愿意投入更多精力做的板塊。

  03

  新場景:AI智能規(guī)劃,輔助家庭教育

  面向家長,洋蔥學(xué)園思考的是如何幫家長更好地融入學(xué)生的學(xué)習(xí)場景中。

  我們經(jīng)常會收到學(xué)生的反饋,比如“自己平時的學(xué)習(xí)壓力大多數(shù)來自于父母,他們根本不知道怎么能讓我學(xué)習(xí)更好,只會跟自己要結(jié)果”。

  另一方面,我們也面訪了不同年齡段學(xué)生的家長。結(jié)果發(fā)現(xiàn),相比我們,很多家長可能不懂科學(xué)的教育方式,但是他們對孩子傾注的心血和愛一定是超過我們的。我們更應(yīng)該做的,不是以一種說教的姿態(tài)去設(shè)計產(chǎn)品,而是考慮如何幫助他們更好地參與到孩子的學(xué)習(xí)場景中。

  家長的第一個痛點就是不知道怎么輔導(dǎo)孩子學(xué)習(xí),由此產(chǎn)生了很多焦慮。

  針對這一問題,在沒有AI參與之前,我們做了家長課堂,來告訴家長如何解決孩子會遇到的常見問題。

  

  如今,我們可以借助AI能力,結(jié)合洋蔥學(xué)園課程研發(fā)團隊的輸出,設(shè)計了能夠匹配不同學(xué)生情況的學(xué)習(xí)規(guī)劃,讓這些學(xué)習(xí)規(guī)劃以更加個性化、有溫度的方式提供給孩子和家長。讓家長和學(xué)生都可以根據(jù)規(guī)劃盡量高效地利用自己的時間和精力。

  家長的第二個痛點是,很多家長完全不了解孩子的學(xué)習(xí)情況,沒有時間關(guān)心孩子。

  為此,洋蔥學(xué)園盡可能多維度地呈現(xiàn)學(xué)情,除了讓學(xué)生了解自己的學(xué)習(xí)情況,還將學(xué)情以適當(dāng)?shù)姆绞胶皖l率同步給家長。目的是做到學(xué)生心里有數(shù)、家長心里有譜。

  

  其中,給學(xué)生的學(xué)情報告很豐富,包含很多細節(jié)。比如他錯的題為什么錯了、應(yīng)該如何進一步提升等等。

  而給家長的學(xué)情分析是更凝練的。家長不再僅是通過孩子每次測試才了解學(xué)習(xí)情況,而是一份長期的數(shù)據(jù)跟蹤,讓家長能夠花最小的精力,真正地參與到孩子的學(xué)習(xí)中。這樣家長會比較放心,同時也會對孩子多一些理解。

  家長的第三個痛點是,他們擔(dān)心報了這些課程,孩子卻學(xué)不下去。

  我們的方案是多管齊下,用一套相對科學(xué)的激勵體系,讓學(xué)生感受到自己內(nèi)化的成長和正反饋,讓他盡可能地堅持學(xué)下去。

  

  我們對激勵體系做了詳細拆解,包括怎么讓學(xué)生感知到學(xué)習(xí)目標(biāo);當(dāng)學(xué)生做不同的學(xué)習(xí)行為時,我們給到他什么樣的激勵反饋;以及這些激勵最終有什么出口。

  進一步拆解來看,用戶在App內(nèi)有各種各樣的行為,指向各種等價的成長值數(shù)值,把這些數(shù)值對標(biāo)到不同的成就等激勵指標(biāo),再進而這些指標(biāo)會反向催生用戶完成更多的學(xué)習(xí)行為。在完成這些行為后,用戶會得到潛移默化的提升,并且會真正愛上學(xué)習(xí)。

  在家長看來,他們的孩子就像愛玩游戲一樣逐漸愛上了使用洋蔥學(xué)園進行學(xué)習(xí)。

  

  

  上圖是洋蔥學(xué)園的游戲化激勵場景之一,App內(nèi)有答題PK場,學(xué)生會像打競技場一樣跟其他同學(xué)PK做題。

  這其中也應(yīng)用了AI能力。比如匹配答題競爭對手時,為了減少匹配時間(并不一定每時每刻都有跟用戶同學(xué)段、學(xué)同學(xué)科、學(xué)習(xí)成果相似的用戶在線),我們會通過歷史上真實用戶的答題記錄形成一個Bot,讓Bot跟真實用戶在線PK,后者對PK的過程也更具真實感。

  用戶完成PK后,會獲得各種各樣的學(xué)習(xí)成就——作業(yè)獵人、備考磚家等。這些成就的名稱會讓學(xué)生覺得有趣,也愿意搜集。

  我們還做了游戲化的等級體系和各種升級任務(wù),也通過虛擬資產(chǎn)讓用戶學(xué)習(xí)時得到一些量化的反饋,比如用戶能通過學(xué)習(xí)積累各種道具豐富自己的個人形象。

  04

  新功能:“暖暖”,基于AI 大語言模型的成長伙伴

  學(xué)習(xí)場景外,還有哪些AI可以發(fā)揮效能,為學(xué)生和家長提供支持,并提升學(xué)生學(xué)習(xí)能力或狀態(tài)的場景?

  洋蔥學(xué)園希望打造的AI智能學(xué)伴,是更有伙伴感、更有信任感的。

  為此,洋蔥學(xué)園孵化了“暖暖”。

  

  這是洋蔥學(xué)園基于大量用戶咨詢的數(shù)據(jù)和問題,投入了具有專業(yè)資質(zhì)的人力資源,結(jié)合生成式人工智能打造的GPT,目標(biāo)是為學(xué)生提供健康成長的陪伴和關(guān)懷。

  洋蔥學(xué)園App內(nèi)有個名為“洋蔥樹洞”的功能,收到過大量用戶的反饋,其中不乏情緒低落的反饋。這種負(fù)面情緒,有些來自于家庭關(guān)系,有些來自于人際交往,有些則是來自于學(xué)業(yè)壓力,在學(xué)生的現(xiàn)實生活中也難以排解。

  因此,“暖暖”誕生了。

  洋蔥學(xué)園基于大量數(shù)據(jù)提煉出典型的心理健康痛點問題,并整理成音視頻課程,放在“暖暖”的功能頁里,可以讓用戶快速找到這些課程。

  當(dāng)用戶的問題并不是這些典型問題時,“暖暖”里還有結(jié)合洋蔥的世界觀構(gòu)建的虛擬人物Bot暖暖老師(虛擬的心理咨詢老師)和同學(xué)IP。基于大語言模型,這些人物會跟用戶溝通,解答疑惑。

  為確保內(nèi)容的準(zhǔn)確,我們在這方面也投入了具備執(zhí)業(yè)資質(zhì)的專業(yè)人力資源一起調(diào)校,并且有非常嚴(yán)格的審核機制,在經(jīng)過大量測試和可行性驗證后,我們才把這個功能推向用戶。

  如果識別到用戶的問題需要真人介入,我們會把這類用戶流轉(zhuǎn)給洋蔥的心理咨詢老師,讓心理咨詢老師介入,提供更加專業(yè)的支持。

  在這個過程中,我們將長期收集的各種用戶典型問題,結(jié)合prompt工程和科學(xué)的工作流設(shè)計,借助專業(yè)的心理咨詢師支持,將大量的用戶咨詢分層處理,最終構(gòu)建了目前版本的“暖暖”。

  在我看來,“暖暖”最有價值的地方在于,真的有那么多的孩子愿意信任洋蔥來傾訴他們心里的疑惑和問題,并且這些問題和困惑能夠被洋蔥學(xué)園看到和重視起來,真正投入各種資源去著手解決。

  這是我們在學(xué)習(xí)場景外,一個更有“伙伴感”的重要嘗試。

  05

  未來產(chǎn)品規(guī)劃

  洋蔥學(xué)園未來產(chǎn)品規(guī)劃中,還會有哪些與AI相結(jié)合的可能?

  其一,堅持從基礎(chǔ)認(rèn)知出發(fā),發(fā)揮洋蔥的優(yōu)勢,做能夠為用戶提供“內(nèi)化成長”的事。

  其二,對技術(shù)的快速發(fā)展和迭代保持足夠的重視和關(guān)注,在質(zhì)變到來時做好準(zhǔn)備。

  我對洋蔥學(xué)園產(chǎn)品團隊的要求是日常都要盡可能多地了解和接觸最前沿的AI技術(shù)發(fā)展,并且多進行嘗試,只有這樣,我們才能對新技術(shù)的能力邊界有相對清晰的感知,進而對產(chǎn)品未來的發(fā)展和迭代方向有想象力。

  06

  Q&A

  提問:您好,我是一名設(shè)計師,目前在一家在線互聯(lián)網(wǎng)教育公司搬磚。我有三個問題請教。

  第一個問題,您講到一個具體落地的場景答疑和判主觀題,設(shè)計AI工具的時候,我們怎么考慮平衡工具的引導(dǎo)性和學(xué)習(xí)動力?

  第二個問題,在整體AI互動過程中,許多地方做不到那么精準(zhǔn),那么有什么兜底措施?

  第三個問題,現(xiàn)在洋蔥學(xué)園改版的風(fēng)格,從產(chǎn)品設(shè)計角度是希望用戶在使用過程中獲得怎樣的情感體驗?這背后的支撐理論是什么?

  林?。?/strong>第一個問題更像是在問基于不同的用戶分層如何更好地滿足他們不同的訴求。

  洋蔥學(xué)園的用戶分層是非常復(fù)雜的:覆蓋了小初高中職所有的學(xué)段年級,這些不同的年級里,學(xué)生情況也不同,比如有擅長學(xué)習(xí)的和不擅長學(xué)習(xí)的,有有目標(biāo)和沒目標(biāo)的。這些不同用戶的客觀屬性和當(dāng)下學(xué)習(xí)情況可以做非常多的分層,每一個用戶都有不同的訴求。

  要為不同用戶提供匹配他們目標(biāo)預(yù)期的產(chǎn)品,我們先要做的是識別用戶的需求:有些用戶可能需要的是工具,那我們就要足夠清晰地呈現(xiàn)工具讓他能比較快地找到這個工具立刻使用;另外一些用戶來了之后,我們要先給他安全感,告訴他放松,跟著我們來就可以搞定。

  這也是我們一直努力的方向。

  第二個問題是關(guān)于學(xué)習(xí)規(guī)劃的。目前絕大多數(shù)學(xué)生的學(xué)習(xí)問題或者他需要的學(xué)習(xí)規(guī)劃還是有共性的。難免有特別個例的情況,但絕大多數(shù)是可以歸類分層的?;谶@些分層,我們盡可能多地做顆粒度,以一個比較合理的成本和可用性服務(wù)好絕大多數(shù)的用戶。

  對于比較特例的用戶,我們會借助AI能力去識別。比如我們做的AI精準(zhǔn)學(xué)功能,當(dāng)用戶開始學(xué)習(xí),他有了一些前置輸入之后,我們對他進行最初的學(xué)情采集,也有一些糾正,他先給我們輸入,我們再給他相對精準(zhǔn)的內(nèi)容推送,幫助他學(xué)到更適合自己的內(nèi)容。這算是一個兜底。

  第三個問題就是洋蔥的設(shè)計風(fēng)格是不是有意為之以及效果怎么樣。截止到三年前,洋蔥學(xué)園最大占比的用戶群體還是初中學(xué)生。隨著這幾年洋蔥學(xué)園的課程在多學(xué)科多學(xué)段多場景的拓展,我們的用戶也逐漸變得更加豐富和多元化。

  對于洋蔥之前最核心的初中用戶群體來說,經(jīng)過大量調(diào)研和測試發(fā)現(xiàn),我們現(xiàn)在的風(fēng)格真正受到用戶的喜歡。因為二次元的國漫美術(shù)風(fēng)格也非?;?,很多學(xué)生非常喜歡。我們在這個基礎(chǔ)上對洋蔥學(xué)園整個視覺設(shè)計進行了一個完整的大改版。

  當(dāng)然,實事求是地說,單一的風(fēng)格肯定不能滿足所有用戶的真實學(xué)習(xí)訴求。比如有些希望來了以后就純想學(xué)習(xí)的用戶會認(rèn)為這種風(fēng)格偏游戲化了。我們現(xiàn)在的風(fēng)格可能需要進行針對性調(diào)整。我們也在努力保證不同喜好的用戶都能在我們的產(chǎn)品內(nèi)獲得符合預(yù)期的學(xué)習(xí)體驗。

  提問2:我來自北京外國語大學(xué)兒童語研究中心。沒有測量就沒有進步,AI在助力教育,目前咱們所出的相關(guān)題目如何保證它的信效度?我看到洋蔥學(xué)園上的練習(xí)的內(nèi)容,質(zhì)量高與低決定學(xué)生學(xué)習(xí)時間的效率高與低。與此同時,這個題目的信度和效度決定A學(xué)生、B學(xué)生和C學(xué)生同樣做一道題精準(zhǔn)度,以及這道題出的可信度高不高。AI如何賦能考試和測評能達到更高的信度和效度?

  林?。?/strong>洋蔥學(xué)園有“老中青”三代組成的專業(yè)教研團隊,其中既包括有30多年教齡的學(xué)科帶頭人、教研員,退休后被我們聘為課程顧問,也包括有多年公立校教學(xué)經(jīng)驗的教育者。他們在教研時會考慮怎么做學(xué)生學(xué)習(xí)能力的分層,并且針對不同的分層提供更適合的學(xué)習(xí)內(nèi)容。

  其次,洋蔥學(xué)園的習(xí)題很多取自于全國各地各種考試的真題。我們會做的一件事情是,由專業(yè)的教研團隊為這些題打上科學(xué)的標(biāo)簽。基于這些標(biāo)簽和大量用戶學(xué)習(xí)真實情況,我們能夠從數(shù)據(jù)維度識別到某種學(xué)習(xí)水平或者某種學(xué)習(xí)習(xí)慣的某類用戶,他們在答具備某些標(biāo)簽的題時正確率如何,他們的成長或者學(xué)習(xí)提升情況如何。結(jié)合這些真實數(shù)據(jù)和教研團隊判斷,我們會進一步完善標(biāo)簽設(shè)計和內(nèi)容推薦的策略,進一步提升整體的學(xué)習(xí)效果。

  提問3:洋蔥學(xué)園也做了數(shù)學(xué)的AI答疑輔導(dǎo),一個特別普遍的問題是,國內(nèi)外數(shù)學(xué)AI答疑輔導(dǎo)里都可能有大模型幻覺帶來的不準(zhǔn)確的問題。您怎么看這個問題?

  林?。?/strong>這個問題特別好。

  首先這是一個工程問題,同時也是一個一邊做、一邊等風(fēng)來的問題。

  答疑場景怎么解決大模型幻覺,我們也做了非常多的測試。落地層面,首先,我們需要確保大語言模型給用戶的回答是基于一個可選的回答框架下的,我們把給用戶答疑的過程拆解成一個個的中間環(huán)節(jié),讓每個環(huán)節(jié)盡可能可控,每個環(huán)節(jié)里讓大模型解決它能力范圍內(nèi)做得比較好的一個點,確保最終輸出的結(jié)果可用度比較高。

  舉個例子,比如我們肯定不能完全借助大模型給到一個題的正確答案。這種情況下,我們會從許多方面嘗試控制它。比如我們要確保這道題在我們的題庫里有正確答案,有標(biāo)準(zhǔn)解析。我們讓大模型基于標(biāo)準(zhǔn)解析,符合洋蔥講述標(biāo)準(zhǔn)和課程設(shè)計邏輯思路,把這個課程一步步地用適合學(xué)生學(xué)習(xí)和理解的方式潤色拆解,再一點點地給到學(xué)生。比如第一步該如何分析思考這個問題,第二步要得到這個結(jié)論應(yīng)該具備哪些能力,一步步地拆解給到用戶。

  我們要做的,第一個是工程設(shè)計,讓這個事情盡量可控,第二個是盡量不讓大模型做它做不好的事。這也是為什么今天大家打開洋蔥學(xué)園會發(fā)現(xiàn),AI智能答疑還不是所有學(xué)段都有的功能。它也在逐漸迭代優(yōu)化測試,讓其可用度一步步變得更高。

  所以我們要先做,同時等風(fēng)來,此時此刻我們能做的就是盡可能地控制這個風(fēng)險。

  相關(guān)閱讀:

  洋蔥學(xué)園十年:App用戶突破1億,布局智慧教育和學(xué)習(xí)機等多個業(yè)務(wù)

  洋蔥學(xué)園:做學(xué)生喜歡的學(xué)習(xí)機,要拆解為三要素

  多知OpenTalk第45期相關(guān)閱讀:

  看山科技創(chuàng)始人梁翃:AI時代,教育行業(yè)要到哪里去?

  END

  本文整理:徐晶晶