<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ActAnywhere

        AI工具9個月前發布 AI工具集
        867 0 0

        ActAnywhere是什么

        ActAnywhere是斯坦福大學與Adobe Research的研究者們聯合開發的一款視頻生成模型,專注于視頻背景的自動生成,尤其是在需要將前景主體(如人類角色)與新背景無縫融合的場景中。此模型在電影制作及視覺效果(VFX)行業中表現出色,能夠高效地創建與前景主體相匹配的視頻背景,顯著減少了傳統手動合成所需的時間和精力。

        ActAnywhere

        官方項目主頁:https://actanywhere.github.io/

        Arxiv論文地址:https://arxiv.org/abs/2401.10822

        主要功能

        • 前景與背景的完美融合:該模型能夠根據前景主體的動態與外觀,自動生成與之相匹配的背景,使得二者之間的互動顯得自然流暢。
        • 基于條件幀的背景生成:用戶可以提供一幅描述新場景的圖像(條件幀),ActAnywhere將基于該圖像生成相應的視頻背景。這使用戶能夠指定特定的背景元素,例如特定的建筑物、自然景觀或室內環境。
        • 時間一致性:利用時間自注意力機制,ActAnywhere確保生成的視頻在時間上保持一致性,包括相機、光照變化及陰影效果。
        • 自監督學習:ActAnywhere通過在大規模人類-場景交互視頻數據集上進行自監督訓練,能夠在沒有人工標注的情況下自我學習如何生成視頻背景。
        • 零樣本學習能力:此模型在未進行額外訓練的情況下,能夠對新的、未見過的數據(如非人類主體)進行生成,顯示出其在背景生成策略上的通用性。

        ActAnywhere的工作原理

        ActAnywhere

        ActAnywhere通過以下步驟和組件生成具有高度真實感和時間連貫性的視頻背景:

        1. 數據準備
          • 采用前景主體分割算法(如Mask R-CNN)從輸入視頻中提取前景主體的分割序列(S)及相應的掩膜(M)。
          • 引入一個條件幀(c),該幀描述所需生成的背景,可以是背景圖像或包含前景與背景的復合幀。
        2. 特征編碼
          • 使用預訓練的變分自編碼器(VAE)對前景主體分割序列進行編碼,得到潛在特征(?S)。
          • 將前景掩膜序列下采樣并與潛在特征對齊,以確保特征維度匹配。
        3. 擴散過程
          • 在訓練階段,利用VAE編碼器將原始視頻幀編碼為潛在表示(Z),然后在正向擴散中逐步添加高斯噪聲。
          • 在測試階段,潛在表示(Z0)初始化為高斯噪聲,并通過逆向擴散過程逐步去噪,以生成最終的視頻幀。
        4. 時間注意力機制
          • 在去噪的U-Net模型中插入模塊,這些模塊包括特征投影層和1D時間自注意力模塊,以確保時間上的連貫性。
          • 通過CLIP圖像編碼器提取條件幀的特征(Fc),并將其注入U-Net的交叉注意力層中,以確保生成的視頻背景與條件幀保持一致。
        5. 訓練目標
          • 使用簡化的擴散目標進行訓練,旨在預測添加的噪聲,通過最小化預測噪聲與真實噪聲之間的差異來優化模型。
        6. 數據增強與處理
          • 在訓練過程中,為應對不完美的分割掩膜,應用隨機矩形裁剪和圖像腐蝕操作。
          • 在測試階段,通過隨機丟棄分割、掩膜或條件幀來實現無分類器的引導。
        7. 模型訓練
          • 在大規模人類-場景交互視頻數據集(HiC+)上進行訓練,該數據集包含240萬個視頻。
          • 使用AdamW優化器,設定學習率為3e-5,凍結共享的VAE和CLIP編碼器,僅微調U-Net。
        8. 生成過程
          • 在測試階段,將前景主體序列和條件幀輸入訓練好的模型,模型將生成與前景主體相協調的視頻背景。

        ActAnywhere的應用場景

        • 視頻背景替換:ActAnywhere能夠將視頻中的前景主體放置于全新的背景中,這在電影制作、廣告、虛擬現實(VR)和增強現實(AR)等領域尤為有用。例如,可以將演員置于虛構場景中,或在不實際拍攝的情況下模擬特定環境。
        • 視覺效果增強:在視覺效果(VFX)制作中,ActAnywhere可用于生成復雜的背景效果,如動態天氣變化、光影效果及人群互動,而無需實際拍攝這些元素。
        • 創意內容制作:藝術家和內容創作者可以利用ActAnywhere快速嘗試并實現他們的創意構想,例如將角色置于不同的歷史時期或未來世界,或與虛構生物互動。
        • 教育與培訓:在教育領域,ActAnywhere可用于創建模擬場景,幫助學生更好地理解復雜概念或歷史,或用于安全培訓,模擬緊急情況。
        • 游戲與娛樂:游戲開發者可以使用ActAnywhere生成動態背景,為玩家提供更豐富、更真實的游戲體驗。同時,它也可以應用于電影預告片、音樂視頻及其他娛樂內容的制作。

        常見問題

        • ActAnywhere可以用于哪些類型的視頻? ActAnywhere適用于各種類型的視頻,無論是電影、廣告還是教育視頻,都能有效生成合適的背景。
        • 使用ActAnywhere需要什么樣的技術背景? 雖然ActAnywhere具有強大的自動化能力,但用戶需具備一定的技術基礎,以便更好地理解和使用該工具。
        • 是否需要額外的硬件支持? 為了獲得最佳效果,建議使用高性能的計算設備,因為視頻生成過程需要處理大量的數據和模型計算。
        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲美女色在线欧洲美女| 亚洲av无码乱码国产精品| 国产精品四虎在线观看免费| 免费观看日本污污ww网站一区| 曰韩亚洲av人人夜夜澡人人爽| 久久夜色精品国产嚕嚕亚洲av| 亚洲美免无码中文字幕在线| 一区二区三区观看免费中文视频在线播放 | 24小时日本在线www免费的| 国产一区二区三区在线观看免费 | 国产免费看JIZZ视频| 国产精品亚洲精品日韩已方| 亚洲欧洲精品在线| 免费手机在线看片| 精品无码人妻一区二区免费蜜桃| 国产极品粉嫩泬免费观看| 国产精品亚洲综合天堂夜夜| 日本免费一区二区在线观看| 国产亚洲人成网站在线观看| 亚洲精品av无码喷奶水糖心| 久草免费手机视频| 亚洲成AⅤ人影院在线观看| 亚洲av极品无码专区在线观看| 久久最新免费视频| 国产无遮挡又黄又爽免费视频| 一级特黄aaa大片免费看| 国产va免费精品观看精品| 亚洲中文字幕无码爆乳| www视频在线观看免费| 亚洲午夜理论片在线观看| 亚洲国产主播精品极品网红| 在线91精品亚洲网站精品成人| 国产亚洲色婷婷久久99精品91| 麻豆精品不卡国产免费看| 亚洲人成网77777亚洲色| 人妻免费久久久久久久了| 亚洲AV网站在线观看| 亚洲综合精品第一页| 精品国产亚洲男女在线线电影| 最近免费中文在线视频| 亚洲成电影在线观看青青|