比阿里EMO搶先開源!蔡徐坤“復(fù)出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區(qū)UP狂喜!看看哪家效果好
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:比阿里EMO搶先開源!蔡徐坤“復(fù)出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區(qū)UP狂喜!看看哪家效果好
關(guān)鍵字:騰訊,面部,模型,視頻,頭部
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):2341字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | Zicy3月26號,騰訊放了個(gè)大招,開源了Audio2Video大模型AniPortrait,話不多說,先看效果!
不得不說,從肌肉到連貫程度,效果都是相當(dāng)驚艷的。可以預(yù)見,以后的視頻網(wǎng)站的鬼畜區(qū)又有新工具了
下面我們先來看看,這個(gè)模型究竟是個(gè)啥東西?
Audio2Video大模型的較量早在2月27號的時(shí)候,阿里就宣布要開源自己的圖生視頻大模型:EMO,還把論文掛到了Arxiv上面
https://arxiv.org/abs/2402.17485
EMO的效果也是相當(dāng)?shù)恼眩阒恍枰峁┮粡堈掌鸵欢稳我庖纛l文件,EMO即可生成會(huì)說話唱歌的 AI 視頻,以及實(shí)現(xiàn)無縫對接的動(dòng)態(tài)小視頻,最長時(shí)間可達(dá)1分30秒左右。表情非常到位,任意語音、任意語速、任意圖像都可以一一對應(yīng)。但現(xiàn)在,EMO的“開源”倉庫是這樣的
只有一個(gè)Readme文件,這波開源屬于是開了個(gè)寂寞。有網(wǎng)友調(diào)侃道
好好好,沒有人比你更懂開源。
阿里本來是靠EMO賺足了噱頭,但這回讓騰訊搶先一步,EMO可能是真要emo了。
AniPortrait是什么總地來說,框架分為兩個(gè)階段。首先,從音頻中提取3D
原文鏈接:比阿里EMO搶先開源!蔡徐坤“復(fù)出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區(qū)UP狂喜!看看哪家效果好
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業(yè)洞見。聚集25萬AI一線開發(fā)者、互聯(lián)網(wǎng)中高管和機(jī)構(gòu)投資人。一線作者來自清北、國內(nèi)外頂級AI實(shí)驗(yàn)室和大廠,兼?zhèn)湫袠I(yè)嗅覺與報(bào)道深度。