<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ActAnywhere

        AI工具8個月前發布 AI工具集
        864 0 0

        ActAnywhere是什么

        ActAnywhere是斯坦福大學與Adobe Research的研究者們聯合開發的一款視頻生成模型,專注于視頻背景的自動生成,尤其是在需要將前景主體(如人類角色)與新背景無縫融合的場景中。此模型在電影制作及視覺效果(VFX)行業中表現出色,能夠高效地創建與前景主體相匹配的視頻背景,顯著減少了傳統手動合成所需的時間和精力。

        ActAnywhere

        官方項目主頁:https://actanywhere.github.io/

        Arxiv論文地址:https://arxiv.org/abs/2401.10822

        主要功能

        • 前景與背景的完美融合:該模型能夠根據前景主體的動態與外觀,自動生成與之相匹配的背景,使得二者之間的互動顯得自然流暢。
        • 基于條件幀的背景生成:用戶可以提供一幅描述新場景的圖像(條件幀),ActAnywhere將基于該圖像生成相應的視頻背景。這使用戶能夠指定特定的背景元素,例如特定的建筑物、自然景觀或室內環境。
        • 時間一致性:利用時間自注意力機制,ActAnywhere確保生成的視頻在時間上保持一致性,包括相機、光照變化及陰影效果。
        • 自監督學習:ActAnywhere通過在大規模人類-場景交互視頻數據集上進行自監督訓練,能夠在沒有人工標注的情況下自我學習如何生成視頻背景。
        • 零樣本學習能力:此模型在未進行額外訓練的情況下,能夠對新的、未見過的數據(如非人類主體)進行生成,顯示出其在背景生成策略上的通用性。

        ActAnywhere的工作原理

        ActAnywhere

        ActAnywhere通過以下步驟和組件生成具有高度真實感和時間連貫性的視頻背景:

        1. 數據準備
          • 采用前景主體分割算法(如Mask R-CNN)從輸入視頻中提取前景主體的分割序列(S)及相應的掩膜(M)。
          • 引入一個條件幀(c),該幀描述所需生成的背景,可以是背景圖像或包含前景與背景的復合幀。
        2. 特征編碼
          • 使用預訓練的變分自編碼器(VAE)對前景主體分割序列進行編碼,得到潛在特征(?S)。
          • 將前景掩膜序列下采樣并與潛在特征對齊,以確保特征維度匹配。
        3. 擴散過程
          • 在訓練階段,利用VAE編碼器將原始視頻幀編碼為潛在表示(Z),然后在正向擴散中逐步添加高斯噪聲。
          • 在測試階段,潛在表示(Z0)初始化為高斯噪聲,并通過逆向擴散過程逐步去噪,以生成最終的視頻幀。
        4. 時間注意力機制
          • 在去噪的U-Net模型中插入模塊,這些模塊包括特征投影層和1D時間自注意力模塊,以確保時間上的連貫性。
          • 通過CLIP圖像編碼器提取條件幀的特征(Fc),并將其注入U-Net的交叉注意力層中,以確保生成的視頻背景與條件幀保持一致。
        5. 訓練目標
          • 使用簡化的擴散目標進行訓練,旨在預測添加的噪聲,通過最小化預測噪聲與真實噪聲之間的差異來優化模型。
        6. 數據增強與處理
          • 在訓練過程中,為應對不完美的分割掩膜,應用隨機矩形裁剪和圖像腐蝕操作。
          • 在測試階段,通過隨機丟棄分割、掩膜或條件幀來實現無分類器的引導。
        7. 模型訓練
          • 在大規模人類-場景交互視頻數據集(HiC+)上進行訓練,該數據集包含240萬個視頻。
          • 使用AdamW優化器,設定學習率為3e-5,凍結共享的VAE和CLIP編碼器,僅微調U-Net。
        8. 生成過程
          • 在測試階段,將前景主體序列和條件幀輸入訓練好的模型,模型將生成與前景主體相協調的視頻背景。

        ActAnywhere的應用場景

        • 視頻背景替換:ActAnywhere能夠將視頻中的前景主體放置于全新的背景中,這在電影制作、廣告、虛擬現實(VR)和增強現實(AR)等領域尤為有用。例如,可以將演員置于虛構場景中,或在不實際拍攝的情況下模擬特定環境。
        • 視覺效果增強:在視覺效果(VFX)制作中,ActAnywhere可用于生成復雜的背景效果,如動態天氣變化、光影效果及人群互動,而無需實際拍攝這些元素。
        • 創意內容制作:藝術家和內容創作者可以利用ActAnywhere快速嘗試并實現他們的創意構想,例如將角色置于不同的歷史時期或未來世界,或與虛構生物互動。
        • 教育與培訓:在教育領域,ActAnywhere可用于創建模擬場景,幫助學生更好地理解復雜概念或歷史,或用于安全培訓,模擬緊急情況。
        • 游戲與娛樂:游戲開發者可以使用ActAnywhere生成動態背景,為玩家提供更豐富、更真實的游戲體驗。同時,它也可以應用于電影預告片、音樂視頻及其他娛樂內容的制作。

        常見問題

        • ActAnywhere可以用于哪些類型的視頻? ActAnywhere適用于各種類型的視頻,無論是電影、廣告還是教育視頻,都能有效生成合適的背景。
        • 使用ActAnywhere需要什么樣的技術背景? 雖然ActAnywhere具有強大的自動化能力,但用戶需具備一定的技術基礎,以便更好地理解和使用該工具。
        • 是否需要額外的硬件支持? 為了獲得最佳效果,建議使用高性能的計算設備,因為視頻生成過程需要處理大量的數據和模型計算。
        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 免费视频爱爱太爽了| 国产激情免费视频在线观看| 曰批全过程免费视频网址| 亚洲国产综合无码一区 | 国产亚洲av片在线观看18女人| 亚洲成av人无码亚洲成av人| 毛片视频免费观看| 亚洲乱妇熟女爽到高潮的片| 午夜电影免费观看| 午夜在线亚洲男人午在线| 免费永久看黄在线观看app| 全黄A免费一级毛片| 亚洲一区二区三区免费| 黄视频在线观看免费| 亚洲爆乳精品无码一区二区三区| 国产在线一区二区综合免费视频| 亚洲国产一区二区三区青草影视 | 亚洲av一本岛在线播放| 免费中文熟妇在线影片| 亚洲国产成人AV网站| 亚洲精品高清在线| 久久精品免费一区二区三区| 亚洲成A∨人片在线观看无码| 成人网站免费观看| 日本激情猛烈在线看免费观看| 亚洲精品少妇30p| 亚洲一区二区三区免费在线观看| 99久久婷婷国产综合亚洲| 可以免费观看的一级毛片| 久久av免费天堂小草播放| 亚洲视频在线观看网站| 四虎在线免费播放| 99视频在线免费观看| 亚洲国产精品综合一区在线| 免费萌白酱国产一区二区| 国产好大好硬好爽免费不卡 | 亚洲午夜一区二区三区| 亚洲国产精品13p| 最近免费中文字幕高清大全| 无码天堂亚洲国产AV| 久久久无码精品亚洲日韩京东传媒|