用戶可以在平臺(tái)直接創(chuàng)建自己的虛擬形象,適配短視頻制作、視頻翻譯等需求。

有道推出“小采樣數(shù)字人平臺(tái)”:10分鐘生成自己的歌

2024-03-11 22:28:15發(fā)布     來源:多知網(wǎng)    作者:Mint  

  多知網(wǎng)3月11日消息,有道智云平臺(tái)今日官宣“小采樣數(shù)字人平臺(tái)”,基于智能化、個(gè)性化積累,用戶可以在平臺(tái)直接創(chuàng)建自己的虛擬形象,適配短視頻制作、視頻翻譯等需求。

  據(jù)介紹,這些虛擬形象可以模仿真人表情動(dòng)作、在多種場景下自然交流,同時(shí)支持照片說話和唱歌功能,靜態(tài)照片與圖像均可以通過語音或旋律更生動(dòng)地表達(dá)。

  截屏2024-03-11 22.30.59.png

  官方推文介紹了幾個(gè)功能:

  在視頻翻譯為例,該功能融合人工智能、自然語言處理和數(shù)字形象合成技術(shù),可以將視頻內(nèi)容轉(zhuǎn)換成多語言版本,包括產(chǎn)品宣傳片、互動(dòng)直播等等。

  以形象克隆為例,該功能可以對真實(shí)人物進(jìn)行一比一的深度復(fù)制,包括視覺上的面部特征、身形輪廓,動(dòng)態(tài)表現(xiàn)的動(dòng)作習(xí)慣、微妙表情,以及聲音質(zhì)感和語氣節(jié)奏等。

  以歌聲合成為例,區(qū)別于語音合成技術(shù)(TTS),有道小采樣數(shù)字人采用的是原創(chuàng)歌聲合成技術(shù),能夠滿足說話、高難度歌曲演繹等需求。用戶上傳一張照片和一段聲音(日常聊天內(nèi)容或歌唱音頻等均可),10分鐘后即可生成。

  目前平臺(tái)talk.youdao.com已經(jīng)免費(fèi)開放。(多知網(wǎng) Mint)