孩子可以發(fā)揮想象力基于AI創(chuàng)作繪本。

小度新物種:添添AI平板機器人來了

2024-04-16 18:26:03發(fā)布     來源:多知    作者:徐晶晶  

  來源|多知

  作者|徐晶晶

  “截至目前,小度自主品牌設(shè)備服務(wù)了4600萬個家庭,同時小度AI智能助手廣泛搭載在超7億臺智能設(shè)備上(小度“大腦”DUEROS累計激活設(shè)備7億臺)。”

  在今日舉行的Create 2024百度AI開發(fā)者大會上,小度科技CEO李瑩披露了小度的成績單。

  小度系列產(chǎn)品還有哪些創(chuàng)新的可能性?

  在這次大會上,小度正式發(fā)布了一個“AI伙伴”——添添AI平板機器人。目前該產(chǎn)品已上線各大電商平臺,預(yù)售嘗鮮價為3699元。

  情感陪伴、影音娛樂、AI健身和AI輕辦公,是添添AI平板機器人的四個核心場景。其中,在情感陪伴里,AI數(shù)字人陪伴兒童、AI繪畫場景值得關(guān)注。

  團隊內(nèi)部稱其為“小度AI的集大成者”。

  李瑩則篤定,未來小度將會成為人人都能擁有的AI伙伴,“它是有用的,更是有靈魂的”。

  01

  可以隨人轉(zhuǎn)動、有豐富表情的平板機器人

  這次發(fā)布的添添AI平板機器人,既是AI平板,又是品質(zhì)音箱。從外形上看,半球形的音箱底座上,用支架支撐著一個可以旋轉(zhuǎn)的12.1英寸平板。

  關(guān)于添添AI平板機器人的硬件定義,小度科技信息娛樂業(yè)務(wù)部總經(jīng)理賈振超分析:

  “我們過去一直思考,有著一個家庭生活好伙伴屬性的硬件載體,到底該擁有哪些特點,應(yīng)該定義哪些必須的功能。

  答案是,首先它得是一個高品質(zhì)的平板,得擁有高清畫質(zhì)的護眼類大屏,要有普通平板所沒有的震撼音效,用這一系列的硬件特性來滿足用戶在追劇、音樂、輕辦公等場景上的需求。

  其次,用戶的家庭出行、辦公等場合的使用也需要覆蓋。因此我們定義了平板、音箱、機器人三種形態(tài),隨意切換,走到哪兒用到哪兒,而且體驗度超級棒。

  最后,為了進一步的提升用戶的體驗,我們讓機身擁有了近乎可360度自由旋轉(zhuǎn)的能力,加上前置的雙高清攝像頭,配上小度的人臉跟蹤和智能跟隨算法,為追劇、視頻通話、家庭安防和家庭看護帶來遠超市場上其他競品的體驗。”

  

  (注:添添AI平板機器人可以實現(xiàn)人臉追隨,水平360°面部智能追隨。這意味著,用戶在借助添添AI平板機器人視頻通話、遠程會議時,能時刻保持居中。據(jù)透露,智能跟隨準確率為98.8%。)

  李瑩表示,對比以前的小度智能音箱,添添AI平板機器人更加聰明、更加能干、更懂用戶。

  更加聰明,體現(xiàn)在語音交互上,用戶可以更加自由地與其交流,借助大模型,其可以實現(xiàn)深度的多輪對話交互,甚至還能預(yù)測用戶的意圖,并且動發(fā)起后續(xù)的追問。“不會像以前的智能音箱一樣很容易把天聊死了。”李瑩說。

  以下是大會現(xiàn)場展示的一段用戶的真實錄音:

  用戶:今天我在公園看到一只超可愛的小狗。

  小度:看到可愛的小狗,總能讓人心情愉快。它是什么品種的呢?

  用戶:我也不認識,它穿了一件超人的背心,在跟主人跑步,好萌啊。

  小度:啊,原來是這樣,看到小狗跑步,是不是覺得它很有活力呢?

  用戶:對,我很喜歡小狗的。

  小度:喜歡小狗是很多人的天性,他們總能給我們帶來快樂和陪伴。你喜歡什么品種的小狗呢?

  用戶:我喜歡哈士奇。

  小度:哈士奇以獨特的藍色眼睛和豐富的表情而聞名。你是不是也覺得它們特別可愛,有打算養(yǎng)一只嗎?

  用戶:有點擔心它拆家呢,還在猶豫中。

  小度:哈哈,它確實讓人又愛又恨。

  在大會現(xiàn)場,百度創(chuàng)始人、董事長兼CEO李彥宏現(xiàn)場演示了添添AI平板機器人的功能。

  他通過多輪對話讓小度制定日程:“小度,幫我安排一下日程。今天活動結(jié)束之后,我會和張總一起晚餐。之后,在酒店有個管理層的會議,大概要一個半小時,希望十點之前結(jié)束。明天早晨我準備晨跑,看看天氣怎么樣,然后上午八點有個早會,請幫我安排好這些日程。”

  

  小度隨即清晰利落地給出了回復:“根據(jù)您的需求,小度給您制定最優(yōu)的日程安排如下:您與張總晚餐安排在18點至19點30分。結(jié)束后,在20點參加管理層會議,21點30分左右結(jié)束。明早六點鬧鐘將提醒您起床去晨跑,跑步時長控制在1個小時以內(nèi),確保明早八點早會不遲到。明早天氣陰轉(zhuǎn)多云,氣溫25度,建議穿著輕便透氣的服裝,并準備輕薄長袖應(yīng)對天氣變化。”

  其實,李彥宏下達的指令需求非常復雜,涉及預(yù)估用時、跨天日程安排、鬧鐘設(shè)置、天氣查詢、根據(jù)天氣提供著裝建議等。但是這款機器人都能夠理解這些指令,并且能夠做出合理的安排和提醒。

  更加能干,體現(xiàn)在:

  為滿足不同用戶的不同需求,添添AI平板機器人能夠靈活調(diào)用各種專業(yè)的智能體。這意味著,“現(xiàn)在小度不是一個人在為你服務(wù),而是身后站著一群智能體的醫(yī)生、老師、律師、國學大師、星座達人、健身教練等等。用戶需要哪一位數(shù)字人,就可以請哪一位出來”。

  全新?lián)Q腦的小度可以成為用戶的AI閨蜜、AI教練、AI家教、AI健康顧問、AI管家等等。

  李瑩特別強調(diào),就小度AI家教來說,其并非提供簡單的搜題、批改作業(yè),而是針對孩子學習的全場景,用AI診斷幫助孩子規(guī)劃個性化的學習路徑,涵蓋課前的預(yù)習,課中的練習,還有課后的復習。

  更懂用戶則體現(xiàn)在,“過去小度都是以助手的身份幫助用戶完成各種任務(wù)。全新升級的小度,不但能干更多的事兒,也更懂你,能夠記住跟你生活在一起的點點點滴滴,變得更有人情味,為我們提供情緒價值。”

  以下是一個例子:

  用戶:小度小度,早上好。

  小度:早上好。

  用戶:夏天馬上來了,我必須要減肥了,以后晚上只吃水果,給我推薦幾款減肥水果吧。

  小度:其實你喜歡吃的火龍果、蘋果、菠蘿就很適合,還有獼猴桃、圣女果、葡萄柚、藍莓,這些也是很好的選擇。

  用戶:那你幫我定個日程,每天晚上提醒我吃水果,并且每天不重樣。

  小度:好的,那我就在每天晚上六點提醒你吃不重樣的水果。

  用戶:好的,謝謝你,來點音樂聽聽。

  小度:好呢,讓我們隨著元氣滿滿的節(jié)奏一起迎接夏天吧(音樂起)……

  02

  情感陪伴:孩子可以用想象力基于AI創(chuàng)作繪本

  在分論壇上,賈振超系統(tǒng)梳理了添添AI平板機器人的四個核心場景:情感陪伴、影音娛樂、AI健身和AI輕辦公。

  在情感陪伴方面,賈振超詳細介紹了幾個功能:

  1.超級表情。

  基于大模型,機器人可以理解用戶的喜怒哀樂。作為一個AI伙伴,現(xiàn)在的小度不僅特別會聊天,其聲音也更擬人化,而且還有很多豐富的表情:你開心,它朝你做個鬼臉;你過生日,機器人會放煙花、吹氣球;你表揚它,它還能給你比心。

  

  據(jù)小度首席研發(fā)架構(gòu)師黃榮升透露,其表情互動準確率超過90%。

  2.AI數(shù)字人。

  團隊基于大模型訓練對話聊天能力,賦予每個數(shù)字人不同的人設(shè),匹配的音色,尤其是面向兒童人群為數(shù)字人定制一系列可愛形象。

  

  賈振超透露,內(nèi)測用戶中,有家長反饋,家里的小朋友會將煩惱一件一件傾訴給屏幕里的數(shù)字人。

  

  3.兒童成長的AI繪畫場景功能。

  這包括AI魔畫(孩子寥寥幾筆的畫,AI可以將其展開成一幅美妙畫作)、AI繪畫導師(指導孩子繪畫并點評)、AI繪本(孩子可以基于想象力制作繪本)三個功能。

  據(jù)黃榮升介紹,AI繪畫導師功能里,簡筆畫Caption(給圖片加說明文字)為85.2%,“我們自己內(nèi)部評測,這個成績比全球SOTA大模型效果還好。”

  據(jù)透露,接下來,團隊還會在添添AI平板機器人上研發(fā)面向孩子的AI音樂創(chuàng)造功能,進一步挖掘孩子在藝術(shù)方面的創(chuàng)作力。

  4.小度星球。

  黃榮升判斷:“大模型時代有兩個趨勢。其一,對話LUI交互成為趨勢,讓交互門檻進一步降低。其二,會產(chǎn)生新的用戶入口級的流量紅利。門檻的降低,使‘一老一小’兩個群體使用大模型的頻次變高。”

  他透露,“目前小度是最大的自然語言對話流量平臺。”

  

  因此,在添添AI平板機器人上,還有一款角色扮演類的應(yīng)用——小度星球。這個應(yīng)用開發(fā)周期僅用了兩周時間,但其流量大,該應(yīng)用在小度平臺上活躍用戶超過百萬,語音交互調(diào)用次數(shù)超過千萬,超出了內(nèi)部的預(yù)期。且效果好,平均對話輪數(shù)相比上一代的最好的技術(shù)提升五倍。

  在影音娛樂方面,據(jù)介紹,影音娛樂是小度設(shè)備最大的用戶場景。利用文心大模型和多模態(tài)大模型,小度在文本理解、視覺理解、記憶和推薦方面,有了很大進步。

  例如,要求小度播放下飯神劇時,小度會立即為用戶播放愛看的劇。當用戶問及(劇里正在吃的)這個面有什么特點時,小度會說:“豬腳面是廣東一帶傳統(tǒng)風味小吃,屬于月菜系,你家附近也有,可以嘗嘗。”

  這段對話的難點包括:能播放下飯神劇,指向的是小度可以記住用戶的歷史喜好;劇情圖片中的面,小度可以識別出來;豬腳面的特點,通過搜索和大模型得到答案。

  值得一提的是,該機器人還有音樂場景的“情緒歌詞”功能。在一首歌播放過程中,添添AI平板機器人可以識別歌詞情緒意圖,生成匹配歌詞視頻,讓用戶擁有沉浸畫面感。

  在AI健身方面,該機器人內(nèi)置AI健身課、AI教練、AI虛擬試衣、健康飲食功能等。

  在AI輕辦公方面,包括上文提到的AI日程(AI日程也已上線小度App,可實現(xiàn)跨端使用)、AI筆記、圖文翻譯、老照片修復等功能。

  賈振超稱添添AI平板機器人為“小度AI的集大成者”。

  李瑩則堅信,“小度將會成為人人都能擁有的AI伙伴,它是有用的,更是有靈魂的。”

  03

  小度完成了一次具有里程碑意義的“換腦革命”,迎來“最強大腦”

  這一切都源于小度擁有了全新的大腦。

  據(jù)介紹,添添AI平板機器人搭載的是全球首個AI原生操作系統(tǒng)——DUEROS X。

  李瑩強調(diào)了它的革新意義:“DUEROS X徹底顛覆了傳統(tǒng)的人適應(yīng)系統(tǒng)的陳舊模式。我們真正做到了端到端地連接用戶的需求和任務(wù)。這個創(chuàng)新極大地拓展了操作系統(tǒng)的邊界。在AI時代,我們認為DUEROS X無疑會成為引領(lǐng)行業(yè)發(fā)展的重要標志??梢哉f,小度完成了一次具有里程碑意義的‘換腦革命’,這是小度在大模型時代的一次質(zhì)的飛躍。我們將迎來小度的‘最強大腦’。”

  據(jù)介紹,小度這一次“換腦革命”是DUEROS X基于文心大模型實現(xiàn)的全面重構(gòu)。

  在模型層,基于MOE模型路由的架構(gòu),它能夠靈活調(diào)度不同的模型以解決不同難度的問題,更高效,更經(jīng)濟,也會更精準。另外還有一個特色,其有長短的個性化的記憶的存儲提取和理解的能力,它能夠清楚地記住歷史的內(nèi)容和用戶的個性化偏好。“用戶用得越多,小度就會越懂用戶。”

  在交互層,小度的多模態(tài)感知的技術(shù)應(yīng)用,讓DUEROS X產(chǎn)生了更加發(fā)豐富的感知力。不論擁護通過語音、文字還是手勢表情來跟小度溝通,它都能夠準確地理解用戶的意圖,并且給出恰當?shù)幕貞?yīng)。同時小度也有擬人化的呈現(xiàn),讓它的表情和形象更加生動有趣,聲音也更自然和靈動,甚至能通過它的動作來表達出它的情緒和個性。

  在生態(tài)層,小度本身已經(jīng)擁有了1.1萬個語音技能。通過文心智能體的生態(tài)開發(fā)出來的應(yīng)用,都能夠無縫接入到小度,極大擴展了DUEROS X的生態(tài)寬度。這些應(yīng)用不僅僅具備專業(yè)的知識和技能,在小度上還可以根據(jù)用戶的喜好和需求進行個性化的定制,提供貼心便捷的服務(wù)。

  “正是通過對模型層、交互層、生態(tài)層的重構(gòu),DUEROS X作為全新的AI native OS,支撐小度完成了全面的換腦,為我們帶來前所未有的智能體驗。我們堅定認為DUEROS X是小度軟硬一體智能化的立身之本,也是小度脫離存量競爭的秘鑰。”李瑩說道。

  END

  本文作者:徐晶晶