Up主已經(jīng)開(kāi)始鬼畜,騰訊開(kāi)源「AniPortrait」讓照片唱歌說(shuō)話
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Up主已經(jīng)開(kāi)始鬼畜,騰訊開(kāi)源「AniPortrait」讓照片唱歌說(shuō)話
關(guān)鍵字:騰訊,序列,網(wǎng)格,模塊,網(wǎng)絡(luò)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):4877字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:PandaAniPortrait 模型是開(kāi)源的,可以暢玩。「小破站鬼畜區(qū)的新質(zhì)生產(chǎn)力工具。」
近日,騰訊開(kāi)源發(fā)布的一個(gè)新項(xiàng)目在推上獲得了如此評(píng)價(jià)。這個(gè)項(xiàng)目是 AniPortrait,其可基于音頻和一張參考圖像生成高質(zhì)量動(dòng)畫(huà)人像。
話不說(shuō)多,我們先看看可能會(huì)被律師函警告的 demo:動(dòng)漫圖像也能輕松開(kāi)口說(shuō)話:該項(xiàng)目剛上線幾天,就已經(jīng)收獲了廣泛好評(píng):GitHub Star 數(shù)已經(jīng)突破 2800。下面我們來(lái)看看 AniPortrait 的創(chuàng)新之處。論文標(biāo)題:AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation
論文地址:https://arxiv.org/pdf/2403.17694.pdf
代碼地址:https://github.com/Zejun-Yang/AniPortrait
AniPortrait
騰訊新提出的 AniPortrait 框架包含兩個(gè)模塊:Audio2Lmk 和 Lmk2Video。
Audio2Lmk 的作用是提取 Landmark 序列,其能從音頻輸
原文鏈接:Up主已經(jīng)開(kāi)始鬼畜,騰訊開(kāi)源「AniPortrait」讓照片唱歌說(shuō)話
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)