AIGC動態歡迎閱讀
原標題:曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
關鍵字:視頻,表情,數據,研究院,肖像
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心發布
機器之心編輯部日前,曠視科技發布了一項新的開源 AI 人像視頻生成框架 ——MegActor。基于該框架,用戶只需輸入一張靜態的肖像圖片,以及一段視頻(演講、表情包、rap)文件,即可生成一段表情豐富、動作一致的 AI 人像視頻。MegActor 所生成的視頻長度,取決于給定的驅動視頻的長度。與阿里 EMO、微軟 VASA 等最新涌現的 AI 視頻模型不同,曠視 MegActor 將采用開源的方式,提供給開發者社區使用。MegActor 能夠呈現出絲毫畢現的效果,面部細節更加豐富自然,畫質更出色。為了進一步展示其泛化性,MegActor 甚至可以讓 VASA 里面的人物肖像和它們的視頻彼此組合生成,得到表情生動的視頻生成結果。即使是對比阿里 EMO 的官方 Case,MegActor 也能生成近似的結果。總的來說,不管是讓肖像開口說話,讓肖像進行唱歌 Rap,還是讓肖像模仿各種搞怪的表情包,MegActor 都可以得到非常逼真的生成效果。論文:https://arxiv.org/abs/2405.20851
代碼地址:https://github.com/megvii-r
原文鏈接:曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...