音頻驅動的唇形同步生成器,可將圖片轉為無限長度生動視頻,免費試用。
音頻驅動全身視頻配音平臺,支持稀疏幀控制和長序列圖像到視頻生成。
SyncAnimation 是一種基于 NeRF 的音頻驅動實時生成說話頭像和上半身動作的技術框架。
一個基于音頻驅動的實時2D聊天頭像生成模型,可在僅使用CPU的設備上實現30fps的實時推理。
基于流匹配的音頻驅動說話人像視頻生成方法
端到端音頻驅動的人體動畫框架
Loopy,僅憑音頻驅動肖像頭像,實現逼真動態。
基于擴散模型的音頻驅動人像和動物圖像動畫技術
EchoMimicV2:實現逼真、簡化、半身人體動畫的技術。
音頻驅動的表情豐富的視頻生成模型
生成逼真、唇同步的說唱視頻
EMO是一款表情豐富的音頻驅動肖像視頻生成框架,通過輸入一張參考圖像和音頻,生成具有豐富面部表情和不同頭部姿勢的角色視頻,適用于音樂視頻制作、影視制作和虛擬主播等場景。,EMO官網入口網址
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙