“在AI時(shí)代,學(xué)生擁有AI導(dǎo)師,教師擁有AI助教?!?/p>

清華、北大、浙大、哈佛……全球高?;ㄊ綋肀IGC

2023-08-28 18:48:43發(fā)布     來(lái)源:多知網(wǎng)    作者:王上  

  來(lái)源|多知網(wǎng)

  作者|王上

  圖片來(lái)源|Pexels

  自ChatGPT橫空出世之后,生成式AI技術(shù)已經(jīng)席卷到高校。

  近日,清華大學(xué)聯(lián)手字節(jié)跳動(dòng)推出全新開(kāi)源大語(yǔ)言模型SALMONN,可支持語(yǔ)音、音頻以及音樂(lè)輸入。

  8月22日,浙江大學(xué)宣布推出多個(gè)垂直大模型,包括「智海-三樂(lè)」教育垂直大模型、「智海-金磐」垂直金融零售語(yǔ)言大模型等。

  據(jù)多知網(wǎng)不完全統(tǒng)計(jì),在國(guó)內(nèi),清華大學(xué)、北京大學(xué)、北京語(yǔ)言大學(xué)、上海交通大學(xué)、西北工業(yè)大學(xué)(或聯(lián)合企業(yè))推出了大模型,而在國(guó)外,哈佛大學(xué)的一門(mén)編程課程也推出了自研大模型,密歇根大學(xué)推出了新的AI平臺(tái)。

  “未來(lái)已來(lái)”不再是一句暢想,正如可汗學(xué)院創(chuàng)始人Sal Khan所預(yù)見(jiàn)的那樣,“在AI時(shí)代,學(xué)生擁有AI導(dǎo)師,教師擁有AI助教。”

WechatIMG65.png

  

  01

  國(guó)內(nèi)高校“百模齊放”

  當(dāng)前,高校大有“百模齊放”之勢(shì)。

  中國(guó)高校的頂流“清北”對(duì)新技術(shù)自然非常關(guān)注。從企業(yè)端大模型來(lái)看,很多創(chuàng)始人出自清華,如百川智能王小川、瀾舟科技周明、小冰公司李笛、面壁智能劉知遠(yuǎn)等。

  而在校園內(nèi),清華大學(xué)不少團(tuán)隊(duì)都在研究大模型,目前由于兩個(gè)團(tuán)隊(duì)做了開(kāi)源大語(yǔ)言模型。

  今年6月,清華大學(xué)NLP實(shí)驗(yàn)室聯(lián)合智源研究院成立的開(kāi)源組織OpenBMB發(fā)布了一個(gè)最高有100億參數(shù)規(guī)模的開(kāi)源大語(yǔ)言模型CPM-BEE,功能包括文字填空、文本生成、問(wèn)答等。

  清華大學(xué)最新和字節(jié)跳動(dòng)合作的又是開(kāi)源大語(yǔ)言模型,不過(guò)SALMONN這個(gè)大模型的長(zhǎng)處是語(yǔ)音,其可支持語(yǔ)音、音頻以及音樂(lè)輸入,他可以感知和理解不同類型的音頻內(nèi)容輸入,并具備多語(yǔ)言語(yǔ)音識(shí)別和翻譯以及語(yǔ)音推理等功能。

  在不少?gòu)臉I(yè)者看來(lái),通用大模型是通才,對(duì)教育領(lǐng)域或者其他特定領(lǐng)域的作用有限,因此,各行各業(yè)需有垂類大模型。就如美國(guó)課外輔導(dǎo)在線教育公司Chegg,原本只是應(yīng)用ChatGPT大模型,現(xiàn)在也在自研教育垂類大模型。在企業(yè)之外,高校在垂類大模型方面也走在了前列。

  今年7月4日,北京大學(xué)聯(lián)合兔展智能推出了中文法律大模型“ChatLaw”,它可以提供提供對(duì)話、寫(xiě)作、知識(shí)庫(kù)三種模式,能給法律小白們答疑解惑、提供法律建議,被網(wǎng)友稱為“大模型中的‘羅翔老師’”。

  7月13日,上海交通大學(xué)重慶人工智能研究院在西部(重慶)科學(xué)城正式發(fā)布“兆言”大模型,這個(gè)是一個(gè)針對(duì)行業(yè)的大模型,“兆言”寓意為“兆文厚積,言出成章”。

  根據(jù)介紹,“兆言”具有精度高、效率高、成本低三大特點(diǎn),更好地賦能制造、醫(yī)療、金融、文旅、法律、服務(wù)等行業(yè)領(lǐng)域。

  浙江大學(xué)也一直關(guān)注技術(shù)前沿,今年4月,微軟亞洲研究院聯(lián)手浙江大學(xué)的研究團(tuán)隊(duì),發(fā)布了一個(gè)大模型協(xié)作系統(tǒng)HuggingGPT,連接HuggingFace社區(qū)中的各種AI模型,來(lái)完成多模態(tài)復(fù)雜任務(wù)。

  今年8月,浙江大學(xué)再進(jìn)一步,推出多個(gè)垂類大模型。

  浙江大學(xué)聯(lián)合高等教育出版社、阿里云等發(fā)布基于通義千問(wèn)7B(70億參數(shù))模型訓(xùn)練的「智海-三樂(lè)」教育垂直大模型,三樂(lè)出自《孟子》“得天下英才而教育之,三樂(lè)也”,這是教育一詞的起源,寓意重視教育是亙古不變的話題。

  根據(jù)介紹,浙江大學(xué)的智海-三樂(lè)教育垂直大模型以阿里云通義千問(wèn)7B通用模型為基座,基于核心教材、領(lǐng)域論文和學(xué)位論文等教科書(shū)級(jí)高質(zhì)量語(yǔ)料和專業(yè)指令數(shù)據(jù)集繼續(xù)預(yù)訓(xùn)練和微調(diào)。智海-三樂(lè)集成了搜索引擎、計(jì)算引擎和本地知識(shí)庫(kù)等功能,將于9月在全國(guó)13所高校應(yīng)用,可提供智能問(wèn)答、試題生成、學(xué)習(xí)導(dǎo)航、教學(xué)評(píng)估等能力。

  浙江大學(xué)人工智能研究所和摸象科技聯(lián)合研發(fā)中國(guó)首個(gè)垂直金融零售的語(yǔ)言大模型「智海-金磐」大模型,可為金融機(jī)構(gòu)提供高效、智能的語(yǔ)言服務(wù),包括金融知識(shí)問(wèn)答、金融文本生成、金融對(duì)話機(jī)器人等多種應(yīng)用場(chǎng)景。

  國(guó)內(nèi)唯一以“語(yǔ)言”命名、以傳播中國(guó)語(yǔ)言文化為主的國(guó)際型大學(xué)北京語(yǔ)言大學(xué)亦是將目光對(duì)準(zhǔn)了垂類模型,推出了國(guó)際中文教育領(lǐng)域的大模型“桃李”(Taoli)1.0。

  根據(jù)介紹,“桃李”在通用中文基座模型上擴(kuò)充了國(guó)際中文教育領(lǐng)域?qū)S性~表,使用了該領(lǐng)域?qū)S袛?shù)據(jù)集進(jìn)行指令精調(diào),增強(qiáng)了大模型在該領(lǐng)域多項(xiàng)任務(wù)上的理解能力。

  在功能上, “桃李”可以根據(jù)學(xué)習(xí)者的情況作出反饋,幫助學(xué)生模擬真實(shí)的語(yǔ)言交際場(chǎng)景;具有文本糾錯(cuò)功能,能夠分別進(jìn)行最小改動(dòng)糾錯(cuò)與流利提升糾錯(cuò),并能深入分析錯(cuò)誤原因;具有作文評(píng)分功能,能夠自動(dòng)對(duì)作文水平進(jìn)行評(píng)判,幫助學(xué)生自主學(xué)習(xí)。

  此外, “桃李”能夠方便國(guó)際中文教師整合教學(xué)資料,提供教學(xué)思路,提升教學(xué)質(zhì)量。例如輔助生成教學(xué)過(guò)程中需要做的教案、幻燈片中需要展示的例句、課堂需要給學(xué)生提供的課外素材等。

  還有一些高校大模型進(jìn)行了預(yù)發(fā)布,比如西北工業(yè)大學(xué)基于華為昇騰AI的面向飛行器的首個(gè)流體力學(xué)大模型——“秦嶺· 翱翔”。

  可以看到,高校研發(fā)的大模型越來(lái)越專業(yè)、細(xì)分。  

  從教育垂類大模型來(lái)看,浙江大學(xué)的智海-三樂(lè)和北京語(yǔ)言大學(xué)的桃李都算是教育的垂類大模型,他們既面向?qū)W生,又面向老師。相比而言,桃李專門(mén)針對(duì)漢語(yǔ)言學(xué)習(xí),會(huì)更細(xì)分。

  此外,很多高校大模型背后都有企業(yè)的身影,比如清華大學(xué)與字節(jié)跳動(dòng)合作,浙江大學(xué)與阿里云合作,西北工業(yè)大學(xué)與華為合作等??梢哉f(shuō),當(dāng)前產(chǎn)教融合進(jìn)入到新階段,前置到技術(shù)研發(fā)層面。

  02

  他山之石:國(guó)外高校重在為我所用?

  跟國(guó)內(nèi)高校聚焦大模型相比,國(guó)外高校似乎更看重為我所用,引導(dǎo)師生用好AI工具。

  雖然有的學(xué)校也推出了大模型,但是更像是為某一門(mén)課程專門(mén)研發(fā),如哈佛大學(xué)。

圖片

  今年6月,哈佛大學(xué)CS50項(xiàng)目導(dǎo)師David Malan教授在郵件中提到,從秋季學(xué)期開(kāi)始,CS50將使用自主研發(fā)的語(yǔ)言模型CS50 Bot作為助教。

  CS50是哈佛大學(xué)入門(mén)級(jí)計(jì)算機(jī)科學(xué)課程,也是計(jì)算機(jī)系王牌課程,同時(shí),CS50是edX上最受歡迎的課程之一,edX(在線教育公司2U旗下平臺(tái))是麻省理工學(xué)院(MIT)和哈佛大學(xué)(Harvard)合作打造的在線學(xué)習(xí)平臺(tái)。

  CS50 Bot是哈佛大學(xué)自研的一個(gè)大語(yǔ)言模型,它將負(fù)責(zé)在課堂上回答學(xué)生的課程問(wèn)題,提供個(gè)性化的指導(dǎo)和代碼debug,給學(xué)生的作業(yè)提出修改意見(jiàn),7*24小時(shí)可以回答各種學(xué)生疑問(wèn)。

  通常,CS50 會(huì)有數(shù)百名校園學(xué)生和 40000 多名在線學(xué)生學(xué)習(xí),現(xiàn)年 46 歲的 Malan 教授表示,即便上課過(guò)程中有 100 多名助教,也很難完全回答來(lái)自不同時(shí)區(qū)、知識(shí)和經(jīng)驗(yàn)水平不同的學(xué)生所提出的問(wèn)題。

  而借助CS50 Bot,該課堂可以解決以上問(wèn)題,且可以實(shí)現(xiàn)1對(duì)1學(xué)習(xí)服務(wù)。

  不過(guò),Malan教授向?qū)W生強(qiáng)調(diào):“不管是接受人還是機(jī)器的信息,我們都要需要有批判思維。”

  可以說(shuō),哈佛大學(xué)推出CS50 Bot,這算高校教育的一個(gè)里程碑。

  在此之前,很多高校認(rèn)為禁止學(xué)生使用AI工具,認(rèn)為會(huì)對(duì)學(xué)生學(xué)習(xí)產(chǎn)生負(fù)面影響;而有的學(xué)校完全放開(kāi),認(rèn)為可以幫助學(xué)生更好的學(xué)習(xí)和成長(zhǎng);還有一些學(xué)校允許學(xué)生有條件地使用,兼顧學(xué)生成長(zhǎng)和教育原則。

  哈佛大學(xué)的做法則受到廣泛認(rèn)可,從解放教師的角度出發(fā),將人工智能工具為我所用;同時(shí),引導(dǎo)學(xué)生正確使用AI工具。

  緊跟著,就在8月22日,密歇根大學(xué)推出了面向全校師生和職工的一個(gè)生成式人工智能平臺(tái),秋季開(kāi)學(xué)開(kāi)始啟用。據(jù)了解,該平臺(tái)是由密歇根大學(xué)信息與技術(shù)服務(wù)部(ITS)開(kāi)發(fā)的,部分功能將在9月30日后收費(fèi)。

  密歇根大學(xué)的校長(zhǎng)小野三太表示:“這是全美第一家提供生成式AI平臺(tái)的學(xué)校。”

12.png

       據(jù)密歇根大學(xué)官網(wǎng)介紹,該大學(xué)將為全社區(qū)提供三種生成式AI服務(wù),包括:U-M GPT、U-M Maizey和U-M GPT Toolkit。

  U-M GPT,允許用戶使用生成式AI工具,如ChatGPT等大模型工具,這項(xiàng)功能將是免費(fèi)的。

  U-M Maizey,它是一個(gè)聊天機(jī)器人和短信系統(tǒng),允許用戶訪問(wèn)人工智能語(yǔ)言模型來(lái)查詢和質(zhì)疑他們自己的數(shù)據(jù)集,U-M Maizey可以連接到谷歌和Canvas等平臺(tái)。

  U-M GPT Toolkit,為用戶大規(guī)模構(gòu)建、訓(xùn)練和托管AI模型提供了平臺(tái),它針對(duì)高級(jí)AI開(kāi)發(fā)者提供了各種需求。

  密歇根大學(xué)可以說(shuō)是有條件地讓學(xué)生使用AI工具的又一個(gè)典范。

  可以說(shuō),今年秋季是一個(gè)新的節(jié)點(diǎn),全球高校開(kāi)啟探索“AI模式”。

  END

  本文作者:王上