曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
關(guān)鍵字:視頻,表情,數(shù)據(jù),研究院,肖像
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心發(fā)布
機(jī)器之心編輯部日前,曠視科技發(fā)布了一項(xiàng)新的開源 AI 人像視頻生成框架 ——MegActor。基于該框架,用戶只需輸入一張靜態(tài)的肖像圖片,以及一段視頻(演講、表情包、rap)文件,即可生成一段表情豐富、動(dòng)作一致的 AI 人像視頻。MegActor 所生成的視頻長度,取決于給定的驅(qū)動(dòng)視頻的長度。與阿里 EMO、微軟 VASA 等最新涌現(xiàn)的 AI 視頻模型不同,曠視 MegActor 將采用開源的方式,提供給開發(fā)者社區(qū)使用。MegActor 能夠呈現(xiàn)出絲毫畢現(xiàn)的效果,面部細(xì)節(jié)更加豐富自然,畫質(zhì)更出色。為了進(jìn)一步展示其泛化性,MegActor 甚至可以讓 VASA 里面的人物肖像和它們的視頻彼此組合生成,得到表情生動(dòng)的視頻生成結(jié)果。即使是對(duì)比阿里 EMO 的官方 Case,MegActor 也能生成近似的結(jié)果。總的來說,不管是讓肖像開口說話,讓肖像進(jìn)行唱歌 Rap,還是讓肖像模仿各種搞怪的表情包,MegActor 都可以得到非常逼真的生成效果。論文:https://arxiv.org/abs/2405.20851
代碼地址:https://github.com/megvii-r
原文鏈接:曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)