有道推出“小采樣數(shù)字人平臺(tái)”：10分鐘生成自己的歌

2024-03-11 22:28:15發(fā)布來源：多知網(wǎng) 作者：Mint

　　多知網(wǎng)3月11日消息，有道智云平臺(tái)今日官宣“小采樣數(shù)字人平臺(tái)”，基于智能化、個(gè)性化積累，用戶可以在平臺(tái)直接創(chuàng)建自己的虛擬形象，適配短視頻制作、視頻翻譯等需求。

　　據(jù)介紹，這些虛擬形象可以模仿真人表情動(dòng)作、在多種場景下自然交流，同時(shí)支持照片說話和唱歌功能，靜態(tài)照片與圖像均可以通過語音或旋律更生動(dòng)地表達(dá)。

　　截屏2024-03-11 22.30.59.png

　　官方推文介紹了幾個(gè)功能：

　　在視頻翻譯為例，該功能融合人工智能、自然語言處理和數(shù)字形象合成技術(shù)，可以將視頻內(nèi)容轉(zhuǎn)換成多語言版本，包括產(chǎn)品宣傳片、互動(dòng)直播等等。

　　以形象克隆為例，該功能可以對真實(shí)人物進(jìn)行一比一的深度復(fù)制，包括視覺上的面部特征、身形輪廓，動(dòng)態(tài)表現(xiàn)的動(dòng)作習(xí)慣、微妙表情，以及聲音質(zhì)感和語氣節(jié)奏等。

　　以歌聲合成為例，區(qū)別于語音合成技術(shù)(TTS)，有道小采樣數(shù)字人采用的是原創(chuàng)歌聲合成技術(shù)，能夠滿足說話、高難度歌曲演繹等需求。用戶上傳一張照片和一段聲音(日常聊天內(nèi)容或歌唱音頻等均可)，10分鐘后即可生成。

　　目前平臺(tái)talk.youdao.com已經(jīng)免費(fèi)開放。（多知網(wǎng) Mint）