Audio2Photoreal官網
從音頻生成全身逼真的虛擬人物形象。它可以從多人對話中語音中生成與對話相對應的逼真面部表情、完整身體和手勢動作。
網站提供:Ai工具箱,Ai開源項目,Audio,Photo,Audio2Photoreal。
Audio2Photoreal簡介
Code and dataset for photorealistic Codec Avatars driven from audio – GitHub – facebookresearch/audio2photoreal: Code and dataset for photorealistic Codec Avatars driven from audio
Meta ai最近發布了一項炸裂的技術:Audio2PhotoReal,從音頻生成全身逼真的虛擬人物形象。它可以從多人對話中語音中生成與對話相對應的逼真面部表情、完整身體和手勢動作。
這些生成的虛擬人物不僅在視覺上很逼真,而且能夠準確地反映出對話中的手勢和表情細節,如指點、手腕抖動、聳肩、微笑、嘲笑等。

Audio2PhotoReal工作原理:
Audio2PhotoReal結合了向量量化的樣本多樣性和通過擴散獲得的高頻細節的優勢,以生成更具動態性和表現力的動作。
1、數據集捕獲:首先捕獲了一組豐富的雙人對話數據集,這些數據集允許進行逼真的重建。
2、模型構建:項目構建了一個包括面部模型、引導姿勢預測器和身體模型的復合模型。
3、面部生成:使用預訓練的唇部回歸器處理音頻,提取面部相關的特征。
利用條件擴散模型根據這些特征生成面部。
4、身體生成:以音頻為輸入,自回歸地輸出每秒1幀的向量量化(VQ)引導姿勢。將音頻和引導姿勢一起輸入到擴散模型中,以30幀/秒的速度生成高頻身體。
5、虛擬人物渲染:將生成的面部和身體傳入訓練好的虛擬人物渲染器,生成逼真的虛擬人物。
6、結果展示:最終展示的是根據音頻生成的全身逼真虛擬人物,這些虛擬人物能夠表現出對話中的細微表情和手勢動作。

Audio2Photoreal項目地址:https://github.com/facebookresearch/audio2photoreal/
Audio2Photoreal論文地址:https://arxiv.org/pdf/2401.01885.pdf
Audio2Photoreal官網入口網址
https://github.com/facebookresearch/audio2photoreal/
OpenI小編發現Audio2Photoreal網站非常受用戶歡迎,請訪問Audio2Photoreal網址入口試用。
數據統計
數據評估
本站OpenI提供的Audio2Photoreal都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 1月 5日 上午9:05收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。