AIGC動態歡迎閱讀
原標題:微軟剛剛發布了VASA-1:單張照片生成超現實真人視頻,還沒開源但是性能SOTA
關鍵字:騰訊,音頻,姿態,頭部,編碼器
文章來源:夕小瑤科技說
內容字數:2779字
內容摘要:
夕小瑤科技說 原創作者 | 任同學還記得阿里巴巴那個讓照片說話的EMO項目嗎?如果還沒有看過相關的報道,可以看一下我們之前發過的文章哦:
比阿里EMO搶先開源!蔡徐坤“復出”唱RAP,騰訊AniPortrait讓照片變視頻,鬼畜區UP狂喜!看看哪家效果好
現在 Microsoft Research 推出了VASA-1項目,同樣是單張人像照片+語音音頻=超現實的說話臉視頻,但是性能SOTA!
VASA-1 可實現精確的唇聲同步,逼真的面部行為,自然的頭部,并支持實時生成!
據作者報道,該 VASA-1 不僅能夠產生與音頻同步的嘴唇動作,而且還能夠捕捉到大量的面部細微差別和自然的頭部動作,從而有助于感知真實性和人物狀態。
可以看到表情非常到位,特別是那靈活的小眼神!
相比之前的高啟強普法視頻,眼神、眉毛的動作顯然要自然很多。
更好的可控性VASA-1 的一個顯著的特性是它可以接受可選信號作為條件,如主眼睛注視方向和頭部距離,以及情緒偏移。這不僅增強了可玩性,重要的是動畫效果更加自然!
▲不同主注視方向(前、左、右、上)下的生成結果
▲不同頭距尺度下的生成結果
▲不同情緒(分別為中性、快
原文鏈接:微軟剛剛發布了VASA-1:單張照片生成超現實真人視頻,還沒開源但是性能SOTA
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189