<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Perception-as-Control

        AI工具4個(gè)月前發(fā)布 AI工具集
        868 0 0

        Perception-as-Control – 阿里通義實(shí)驗(yàn)室推出的圖像動畫框架

        Perception-as-Control是什么

        Perception-as-Control是阿里巴巴通義實(shí)驗(yàn)室推出的一種先進(jìn)圖像動畫框架,旨在根據(jù)用戶的需求實(shí)現(xiàn)對的精細(xì)控制。該框架通過構(gòu)建3D感知表示,將相機(jī)和物體的轉(zhuǎn)化為直觀且一致的視覺效果,利用感知結(jié)果作為控制信號,支持多種與相關(guān)的視頻合成任務(wù)。Perception-as-Control采用基于U-Net架構(gòu)的擴(kuò)散模型,結(jié)合參考圖像的外觀信息與控制信號,生成可控的圖像動畫。此外,該框架實(shí)施了三階段訓(xùn)練策略,以平衡相機(jī)與物體的控制,展現(xiàn)出卓越的表現(xiàn)。

        Perception-as-Control

        Perception-as-Control的主要功能

        • 細(xì)致的協(xié)同控制:實(shí)現(xiàn)相機(jī)與物體的協(xié)同控制,使用戶能夠以細(xì)致的方式調(diào)整動畫中的各個(gè)元素,從而精準(zhǔn)地操控場景中的物體及相機(jī)視角的變化。
        • 多樣化的相關(guān)視頻合成任務(wù):支持多種相關(guān)的視頻合成任務(wù),包括圖像基礎(chǔ)的生成、視頻克隆、轉(zhuǎn)移及編輯。
          • 生成:根據(jù)用戶提供的參考圖像和2D軌跡生成動畫。
          • 克隆:復(fù)刻源視頻中的相機(jī)和物體。
          • 轉(zhuǎn)移:將源視頻中的局部遷移到參考圖像中不同位置和大小的對象上。
          • 編輯:用戶提供分割掩碼,編輯掩碼內(nèi)的。
        • 3D感知表示:通過構(gòu)建3D感知表示,將復(fù)雜的3D場景簡化為關(guān)鍵對象部分(以單位球表示)和世界包絡(luò),實(shí)現(xiàn)直觀且一致的視覺效果。

        Perception-as-Control的技術(shù)原理

        • 3D感知表示:將3D場景簡化為關(guān)鍵對象部分(以單位球表示)和世界包絡(luò),利用3D點(diǎn)跟蹤和視覺里程計(jì)技術(shù)捕捉局部物體與全局相機(jī)。
        • 網(wǎng)絡(luò)架構(gòu):基于去噪U(xiǎn)-Net架構(gòu),采用兩個(gè)輕量級編碼器分別編碼相機(jī)和物體的控制信號,避免RGB級別的干擾,并通過融合模塊合并編碼信號。
        • 參考圖像注入:ReferenceNet將參考圖像的外觀信息注入生成過程,確保生成的視頻保留參考圖像的特定外觀。
        • 三階段訓(xùn)練策略
          • 第一階段:僅訓(xùn)練相機(jī)編碼器,處理只包含相機(jī)的視頻剪輯。
          • 第二階段:引入物體編碼器和融合模塊,處理包含相機(jī)和物體的視頻剪輯。
          • 第三階段:基于稀疏單位球?qū)崿F(xiàn)精細(xì)的物體控制,自適應(yīng)確定每個(gè)渲染點(diǎn)的控制范圍。
        • 擴(kuò)散模型:利用圖像擴(kuò)散概率模型的基本原理,采用去噪U(xiǎn)-Net架構(gòu)生成視頻,優(yōu)化目標(biāo)為最小化預(yù)測噪聲與實(shí)際噪聲之間的差異,條件輸入包括參考圖像和控制信號。

        Perception-as-Control的項(xiàng)目地址

        Perception-as-Control的應(yīng)用場景

        • 電影與視頻特效:生成具有特定的動畫場景,模仿現(xiàn)有視頻中的復(fù)雜,或?qū)⒁粋€(gè)角色的轉(zhuǎn)移到另一個(gè)角色上。
        • 游戲開發(fā):為游戲角色和物體創(chuàng)造自然且可控的動畫,提升游戲的沉浸感與動態(tài)效果。
        • 虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR):在VR環(huán)境中生成實(shí)時(shí)動畫反饋,增強(qiáng)用戶的互動體驗(yàn);在AR應(yīng)用中將虛擬物體動畫與現(xiàn)實(shí)場景相結(jié)合。
        • 廣告與營銷:生成引人注目的動態(tài)廣告和品牌推廣動畫,提升品牌形象和記憶點(diǎn)。
        • 教育與培訓(xùn):生成科學(xué)實(shí)驗(yàn)動畫和技能培訓(xùn)模擬動畫,幫助學(xué)生和學(xué)員更好地理解和掌握知識與技能。
        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 老汉精品免费AV在线播放| 久久精品亚洲男人的天堂| 最近免费mv在线观看动漫| 亚洲中文字幕日本无线码| 国产精品亚洲成在人线| 国产日产成人免费视频在线观看| 久久aa毛片免费播放嗯啊| 思思久久99热免费精品6| 日韩亚洲国产综合高清| 91在线亚洲精品专区| 中文字幕亚洲综合久久菠萝蜜| 国产精品国产免费无码专区不卡| 91九色精品国产免费| 久久国产乱子免费精品| 国产精品永久免费| 一级毛片视频免费观看 | 国产99精品一区二区三区免费 | 久久国产免费福利永久| 国产免费网站看v片在线| 在线播放免费人成视频网站| 亚洲aⅴ无码专区在线观看春色 | 中国国语毛片免费观看视频| 日韩久久无码免费毛片软件| 久久亚洲色WWW成人欧美| 亚洲精品国产av成拍色拍| 亚洲欧美日韩一区二区三区在线 | 西西大胆无码视频免费| 8888四色奇米在线观看免费看| 免费视频一区二区| 男人进去女人爽免费视频国产| 十八禁视频在线观看免费无码无遮挡骂过| 一个人免费观看日本www视频 | 国产成人无码免费视频97 | 亚洲精品日韩一区二区小说| 亚洲av一本岛在线播放| 亚洲人成免费网站| 中文文字幕文字幕亚洲色| 国内精品久久久久影院亚洲| 亚洲午夜精品一区二区麻豆| 亚洲AV日韩综合一区| 美女视频黄.免费网址|