<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ConceptMaster

        AI工具6個月前發(fā)布 AI工具集
        516 0 0

        ConceptMaster – 高保真多概念視頻定制生成的創(chuàng)新 AI 框架

        ConceptMaster是一種前沿的框架,專門用于定制多概念視頻。該系統(tǒng)無需進行額外的調(diào)優(yōu)即可在擴散Transformer模型的基礎(chǔ)上,生成高質(zhì)量且概念一致的定制視頻。通過學習解耦的多概念嵌入,并將其注入到擴散模型中,ConceptMaster有效解決了多概念視頻定制過程中身份解耦的挑戰(zhàn),即便面對高度相似的視覺概念,也能確保每個概念的獨特性和保真度。

        ConceptMaster是什么

        ConceptMaster是一項創(chuàng)新的多概念視頻定制框架,能夠在無需測試時進行調(diào)優(yōu)的情況下,通過擴散Transformer模型生成高質(zhì)量且概念一致的定制視頻。該框架通過學習解耦的多概念嵌入并注入至擴散模型中,成功解決了視頻定制中的身份解耦問題,確保在面對高度相似的視覺概念時,每個概念都能保持其特有的特征。

        ConceptMaster

        ConceptMaster的主要功能

        • 多概念視頻定制:能夠根據(jù)多個參考圖像生成高質(zhì)量的定制視頻,并且無需在測試階段進行額外調(diào)整。例如,用戶可以根據(jù)“一個男人在海邊彈吉他”和“一個女人在橋前親吻”的圖像生成相應(yīng)概念的視頻。
        • 身份解耦問題的解決:通過學習解耦的多概念嵌入,ConceptMaster能夠地將這些嵌入注入擴散模型,從而確保定制視頻的高質(zhì)量。即使在高度相似的視覺概念之間,系統(tǒng)也能精準區(qū)分各自的屬性。
        • 高質(zhì)量數(shù)據(jù)收集:建立了一個系統(tǒng)的數(shù)據(jù)構(gòu)建管道,能夠跨多種概念精確收集視頻實體數(shù)據(jù),為訓練出能夠良好表示和解耦各種概念的模型提供了堅實支持,收集了超過130萬對涵蓋人類、生物及各類物體的視頻實體。
        • 綜合基準測試:設(shè)計了一套全面的基準測試,涵蓋概念保真度、身份解耦能力和視頻生成質(zhì)量三個關(guān)鍵維度,評估模型在六種不同概念組合情景下的表現(xiàn),為多概念視頻定制模型的性能提供了全面參考。

        ConceptMaster的技術(shù)原理

        • 擴散Transformer模型基礎(chǔ):ConceptMaster基于Transformer的潛在擴散模型構(gòu)建,使用3D變分自編碼器(3D-VAE)將視頻從像素空間轉(zhuǎn)換到潛在空間,并在此基礎(chǔ)上構(gòu)建Transformer模型。
        • 多概念嵌入學習與注入
          • 視覺概念表示提取:利用CLIP圖像編碼器從參考圖像中提取密集的視覺標記,隨后通過可學習的Q-Former網(wǎng)絡(luò),將這些標記用作查詢,提取更全面的視覺語義表示。
          • 解耦內(nèi)部配對嵌入:將提取到的視覺表示與相應(yīng)的文本標簽結(jié)合,創(chuàng)建多模態(tài)概念表示。與直接將視覺表示與文本嵌入組合的方法不同,ConceptMaster使用T5編碼器分別對每個概念標簽進行編碼,并引入解耦注意力模塊(DAM),進行內(nèi)部配對注意力操作,充分挖掘文本標簽信息,增強每個概念的特定表示。
          • 多概念嵌入組合與注入:將每個概念的多模態(tài)表示組合成復合嵌入,并設(shè)計多概念注入器(MC-Injector)以交叉注意力的方式將其嵌入到擴散Transformer模型中。MC-Injector作為額外的專用交叉注意力層,位于每個Transformer塊中原有文本交叉注意力層之后,能夠有效學習概念而不受原有文本交叉注意力的干擾,從而增強多個身份的表示。
        • 數(shù)據(jù)構(gòu)建管道
          • 快速篩選不合適的視頻:從互聯(lián)網(wǎng)收集超過640萬段視頻作為原始數(shù)據(jù),通過使用PySceneDetect工具剔除包含場景轉(zhuǎn)換、低光流分數(shù)及低光照對比度的視頻,以確保視頻數(shù)據(jù)維持高標準。
          • 細粒度身份信息提取:準確提取每個身份的區(qū)域和文本標簽。利用LISA(基于MLLM的分割器)結(jié)合文本提示和圖像,憑借強大的視覺推理能力提取實體掩碼,去除過大、過小或高度碎片化的掩碼,從中得出框區(qū)域,并通過CLIP分類去除誤分類的區(qū)域。
        • 輔助數(shù)據(jù)集聯(lián)合訓練:除了構(gòu)建的MCVC數(shù)據(jù)外,ConceptMaster還利用輔助數(shù)據(jù)集增強概念表示。復制了BLIPDiffusion的單概念圖像數(shù)據(jù)集(約30萬)以增強高特異性概念,同時納入了CelebV單概念視頻數(shù)據(jù)集(約6萬)以改善人物表示。構(gòu)建數(shù)據(jù)、BLIP-Diffusion和CelebV的數(shù)據(jù)采樣比例為8:1:1。

        ConceptMaster的項目地址

        ConceptMaster的應(yīng)用場景

        • 視頻內(nèi)容創(chuàng)作:電影和電視劇制作團隊可以利用ConceptMaster根據(jù)劇本中特定場景的描述,快速生成包含多個角色和道具的概念視頻,為實際拍攝提供創(chuàng)意參考和視覺指導。
        • 動畫制作:動畫師可以借助ConceptMaster根據(jù)角色設(shè)計和故事情節(jié),生成動畫片段的初步版本,從而提高創(chuàng)作效率。
        • 游戲開發(fā):游戲開發(fā)者可以使用ConceptMaster生成游戲中的過場動畫、角色動作演示等視頻內(nèi)容,以豐富游戲的劇情表現(xiàn)和角色塑造。
        • 產(chǎn)品展示與推廣:企業(yè)能夠利用ConceptMaster制作產(chǎn)品宣傳視頻,將產(chǎn)品的外觀、功能及使用場景等多個概念融合到一段視頻中。

        常見問題

        • ConceptMaster的使用是否復雜?:ConceptMaster的設(shè)計旨在簡化用戶體驗,用戶只需提供參考圖像,系統(tǒng)即可自動生成定制視頻。
        • 生成的視頻質(zhì)量如何?:ConceptMaster能夠輸出高質(zhì)量的視頻,確保概念的一致性和清晰度。
        • 是否需要特定的硬件支持?:由于ConceptMaster基于現(xiàn)代深度學習框架,建議使用具備良好運算能力的硬件以提升生成效率。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 久久久久亚洲AV无码麻豆| 日韩在线视频免费看| 亚洲中文字幕不卡无码| 理论秋霞在线看免费| 国产美女被遭强高潮免费网站| 国产精品亚洲综合五月天| 国产妇乱子伦视频免费| av片在线观看永久免费| 亚洲精品免费在线观看| 亚洲av无码精品网站| 午夜视频免费在线观看| 亚洲综合色一区二区三区小说| 粉色视频成年免费人15次| 久久久精品免费视频| 亚洲国产美国国产综合一区二区| 免费无码又爽又刺激高潮软件| 久久亚洲国产伦理| 国产精品亚洲专区一区| 亚洲国产婷婷香蕉久久久久久| 日韩大片在线永久免费观看网站| 97在线视频免费| AV在线播放日韩亚洲欧| 91精品全国免费观看青青| 久久久无码精品亚洲日韩按摩| 久久久久久国产a免费观看黄色大片| 深夜国产福利99亚洲视频| 国产精品无码免费专区午夜| 亚洲乱码国产乱码精品精| 18禁黄网站禁片免费观看不卡| 亚洲av片不卡无码久久| 免费国产成人午夜在线观看| 亚洲妓女综合网99| 免费人成在线观看网站品爱网| 亚洲成年人免费网站| 免费国内精品久久久久影院| 久久精品无码免费不卡| 亚洲国产日韩女人aaaaaa毛片在线| 好吊妞788免费视频播放| 中文字幕不卡高清免费| 国产成人精品久久亚洲高清不卡 | 久久青草免费91观看|