本次競(jìng)賽的賽題是解決非母語兒童語音識(shí)別問題。

再獲國(guó)際AI頂會(huì)雙料冠軍,好未來語音識(shí)別技術(shù)已應(yīng)用到多個(gè)產(chǎn)品

2021-04-12 18:01:07發(fā)布     來源:多知網(wǎng)    作者:Penny  

  多知網(wǎng)4月12日消息,近日,好未來斬獲INTERSPEECH 2021“非母語兒童識(shí)別”(The INTERSPEECH 2021 shared task on Automatic Speech Recognition for non-native children’s speech)雙料冠軍。INTERSPEECH作為由國(guó)際語音通信協(xié)會(huì)ISCA組織的語音研究領(lǐng)域的頂級(jí)會(huì)議,是全球最大的綜合性語音信號(hào)處理領(lǐng)域的科技盛會(huì)之一,好未來最終以詞錯(cuò)率低于第二名而奪冠。

  本次競(jìng)賽的賽題是解決非母語兒童語音識(shí)別問題。由于兒童語音天生的差異性,包含生理差異(如兒童聲道長(zhǎng)度較短)、認(rèn)知差異(如語言習(xí)得水平較低,常出現(xiàn)語法邏輯錯(cuò)誤、發(fā)音前置錯(cuò)誤、發(fā)音不完整和語種混雜等情況),以及行為差異(如兒童習(xí)慣低聲私語)等,導(dǎo)致通用語音識(shí)別模型難以適配,這就讓非母語兒童語音識(shí)別系統(tǒng)的構(gòu)建更具挑戰(zhàn)性。另一方面則是非母語兒童語音的數(shù)據(jù)資源較為稀缺,使得常規(guī)聲學(xué)建模方法在該場(chǎng)景下很難奏效。

  針對(duì)上述挑戰(zhàn),好未來AI語音團(tuán)隊(duì)?wèi){借在實(shí)際教育場(chǎng)景中積累的豐富經(jīng)驗(yàn),充分結(jié)合兒童語音在生理特征及語言認(rèn)知方面的特殊性,嘗試了不同的解決方法。比如在數(shù)據(jù)及特征層面,采用對(duì)不同學(xué)齡階段的兒童進(jìn)行歸一化、非語言符號(hào)共享、非流利語料生成、分級(jí)語言模型構(gòu)建、半監(jiān)督語音活動(dòng)檢測(cè)等方法進(jìn)行針對(duì)性優(yōu)化;在聲學(xué)建模層面,采用深度多流CNN與無監(jiān)督pre-training結(jié)合的方案,提升低資源場(chǎng)景下的非母語兒童語音識(shí)別性能。

圖片7.png

  圖:競(jìng)賽系統(tǒng)最終排名,好未來(tal_speech)遙遙領(lǐng)先

  競(jìng)賽中,好未來最終提交的系統(tǒng)以詞錯(cuò)率低于第二名而奪得冠軍。該系統(tǒng)更加適配兒童語音識(shí)別場(chǎng)景,識(shí)別結(jié)果準(zhǔn)確度更高,更重要的是這項(xiàng)技術(shù)的進(jìn)階與應(yīng)用,能夠更大程度地避免通用模型識(shí)別兒童語音不準(zhǔn)確對(duì)孩子學(xué)習(xí)自信心和積極性造成的負(fù)面影響。

  本次成功摘取“雙冠”的語音識(shí)別技術(shù),已經(jīng)廣泛應(yīng)用于好未來旗下各教育產(chǎn)品中,解決教育場(chǎng)景中的真實(shí)問題。

  一方面,好未來用AI語音技術(shù)充分調(diào)動(dòng)孩子的積極性,為他們提供全新的學(xué)習(xí)體驗(yàn)。如好未來將AI語音識(shí)別應(yīng)用于語文、英語的字詞學(xué)習(xí)環(huán)節(jié),對(duì)學(xué)生語音實(shí)時(shí)轉(zhuǎn)錄,結(jié)合語音評(píng)測(cè)技術(shù),判斷學(xué)生對(duì)知識(shí)點(diǎn)的掌握度,智能地推送學(xué)習(xí)內(nèi)容,個(gè)性化地安排學(xué)習(xí)進(jìn)度和學(xué)習(xí)路徑。

  另一方面,AI語音技術(shù)也被應(yīng)用到學(xué)而思培優(yōu)小班課的消息盒子與學(xué)而思網(wǎng)校大班課的語音彈幕功能中。該技術(shù)能夠?qū)⒑⒆拥陌l(fā)言實(shí)時(shí)展現(xiàn),及時(shí)反饋,激勵(lì)孩子主動(dòng)融入課堂,探索學(xué)習(xí)的樂趣,讓課堂不再是老師的“獨(dú)角戲”。課后孩子與老師的互動(dòng)同樣值得關(guān)注,不擅長(zhǎng)打字的孩子,也可以在AI語音技術(shù)的幫助下參與到課后留言討論中,減少師生間的距離感,讓孩子更愿意表達(dá)。

  不僅如此,在培養(yǎng)學(xué)生口語表達(dá)能力方面,AI語音技術(shù)也大有可為。“萌娃小講師”是學(xué)而思培優(yōu)頗具代表性的線下口語表達(dá)活動(dòng),旨在培養(yǎng)孩子內(nèi)在自信、邏輯思維等能力。好未來自主研發(fā)的口語表達(dá)能力測(cè)評(píng)解決方案,支持從流利度、情感、內(nèi)容相關(guān)度、語義邏輯等多重維度,對(duì)孩子的口語表達(dá)過程進(jìn)行實(shí)時(shí)評(píng)測(cè),讓孩子隨時(shí)隨地進(jìn)行口述題練習(xí),并且及時(shí)獲得反饋報(bào)告,激發(fā)孩子的主動(dòng)學(xué)習(xí)意識(shí)。

  AI語音技術(shù)的國(guó)際認(rèn)可與創(chuàng)新應(yīng)用,是好未來18年來用前沿科技推動(dòng)教育進(jìn)步的一個(gè)縮影。近年來,好未來獲批承建智慧教育國(guó)家新一代人工智能開放創(chuàng)新平臺(tái),并與清華大學(xué)、中科院計(jì)算所等6所高校院所建立起緊密的產(chǎn)學(xué)研合作;為解決教育實(shí)際問題而生的幾十項(xiàng)學(xué)術(shù)成果入選ICASSP、NeurIPS、AAAI、WWW、EMNLP、AIED、NCME等國(guó)際頂級(jí)學(xué)術(shù)會(huì)議;好未來AI中臺(tái)也在2020年接連斬獲世界計(jì)算機(jī)視覺領(lǐng)域頂級(jí)會(huì)議CVPR-EmotioNet競(jìng)賽冠軍、世界人機(jī)交互與普適計(jì)算領(lǐng)域頂級(jí)會(huì)議UbiComp競(jìng)賽冠軍、中國(guó)計(jì)算語言學(xué)大會(huì)CCL2020競(jìng)賽冠軍等榮譽(yù),這都得益于好未來對(duì)科技研發(fā)的大力投入和對(duì)底層科研能力的構(gòu)建。

  好未來的AI探索已形成語音技術(shù)、視覺理解、自然語言處理和數(shù)據(jù)挖掘四大方向,探索落地從課前到課后、從內(nèi)容到服務(wù)、覆蓋“教、學(xué)、測(cè)、練、評(píng)”各教學(xué)環(huán)節(jié)的100余項(xiàng)AI能力、10余項(xiàng)教育場(chǎng)景AI解決方案,支撐包括學(xué)而思培優(yōu)、學(xué)而思網(wǎng)校、學(xué)而思1對(duì)1、小猴啟蒙、題拍拍等好未來旗下幾乎所有業(yè)務(wù)部門。