<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態也自然,復旦百度等出品|GitHub攬星1k+

        AIGC動態11個月前發布 量子位
        305 0 0

        霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態也自然,復旦百度等出品|GitHub攬星1k+

        AIGC動態歡迎閱讀

        原標題:霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態也自然,復旦百度等出品|GitHub攬星1k+
        關鍵字:特征,音頻,編碼器,模型,視覺
        文章來源:量子位
        內容字數:0字

        內容摘要:


        西風 發自 凹非寺量子位 | 公眾號 QbitAI一張人像、一段音頻參考,就能讓霉霉在你面前唱碧昂絲的《Halo》。
        一種名為Hallo的研究火了,GitHub已攬星1k+。
        話不多說,來看更多效果:
        不論是說話還是唱歌,都能和各種風格的人像相匹配。從口型到眉毛眼睛動作,各種五官細節都很自然。
        單獨拎出不同動作強度的比較,動作幅度大也能駕馭:
        單獨調整嘴唇幅度,表現是這樣嬸兒的:
        有不少網友看過效果后,直呼這是目前最好的開源口型同步視頻生成:
        這項工作由來自復旦大學、百度、蘇黎世聯邦理工學院和學的研究人員共同完成。
        團隊提出了分層的音頻驅動視覺合成模塊,將人臉劃分為嘴唇、表情和姿態三個區域,分別學習它們與音頻的對齊關系,再通過自適應加權將這三個注意力模塊的輸出融合在一起,由此可以更精細地建模音視頻同步。
        Hallo長啥樣?如前文所述,Hallo通過使用參考圖像、音頻序列以及可選的視覺合成權重,結合基于分層音頻驅動視覺合成方法的擴散模型來實現。
        整體架構是這樣嬸兒的:
        參考圖像經過一個ReferenceNet編碼全局視覺特征;人臉編碼器提取身份相關的特征;音頻編碼器將輸入語音轉


        原文鏈接:霉霉開口唱碧昂絲的歌,又是AI!口型不出戲,五官姿態也自然,復旦百度等出品|GitHub攬星1k+

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲Av高清一区二区三区| 老司机亚洲精品影院| 亚洲高清国产拍精品熟女| www.999精品视频观看免费| 亚洲美女视频一区二区三区| 亚洲AV无码一区二区三区DV| 老司机精品免费视频| 亚洲成在人线aⅴ免费毛片| 亚洲国产成人超福利久久精品| 久久狠狠躁免费观看| 国产国产人免费人成免费视频 | 国产精品高清免费网站| 毛茸茸bbw亚洲人| 国产免费AV片在线观看| 91亚洲国产成人久久精品网站| 国内精自视频品线六区免费| 亚洲色无码专区一区| 国产日产成人免费视频在线观看| 看成年女人免费午夜视频| AV在线亚洲男人的天堂| 18禁在线无遮挡免费观看网站| 亚洲欧洲日产国码二区首页| 97人伦色伦成人免费视频| 国产成人 亚洲欧洲| 亚洲色欲久久久久综合网| 在线观看片免费人成视频无码| 亚洲第一精品电影网| 永久免费的网站在线观看| 小说区亚洲自拍另类| 国产亚洲精品国看不卡| 99re这里有免费视频精品| 亚洲码和欧洲码一码二码三码 | 美女裸免费观看网站| 久久久久久a亚洲欧洲aⅴ| 91免费国产在线观看| 羞羞的视频在线免费观看| 久久久久久亚洲精品| 久久香蕉国产线看免费| 亚洲久悠悠色悠在线播放| 国产精品V亚洲精品V日韩精品| 国产香蕉免费精品视频|