<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        SynCD

        AI工具3個(gè)月前更新 AI工具集
        859 0 0

        SynCD – Meta和卡內(nèi)基梅隆大學(xué)開源的文生圖合成訓(xùn)練數(shù)據(jù)集

        SynCD是什么

        SynCD(Synthetic Customization Dataset)是由卡內(nèi)基梅隆大學(xué)和Meta共同開發(fā)的高質(zhì)量合成數(shù)據(jù)集,旨在提升文本到圖像生成模型的個(gè)性化能力。該數(shù)據(jù)集包含同一對象在不同光照、背景和姿態(tài)下的多種圖像,采用共享注意力機(jī)制(Masked Shared Attention)和3D資產(chǎn)引導(dǎo)(如Objaverse)來確保對象在不同圖像中的一致性。SynCD通過語言模型(LLM)生成豐富的對象描述和背景場景,并結(jié)合深度引導(dǎo)的文本到圖像生成模型,生成配對圖像。它有效解決了現(xiàn)實(shí)世界中多視角、多背景對象圖像難以大規(guī)模收集的問題,為無調(diào)優(yōu)(tuning-free)的模型定制化提供了豐富的訓(xùn)練資源,顯著提高了模型在生成新場景中特定對象時(shí)的圖像質(zhì)量和身份一致性。

        SynCD

        SynCD的主要功能

        • 豐富的訓(xùn)練樣本提供:生成多角度和多背景下的圖像,增強(qiáng)模型對對象的視覺理解能力。
        • 對象一致性增強(qiáng):利用共享注意力機(jī)制和3D資產(chǎn)引導(dǎo),確保不同圖像中對象特征的一致性,避免特征漂移。
        • 生成質(zhì)量提升:通過高質(zhì)量的合成數(shù)據(jù),改善模型在定制化任務(wù)中的圖像質(zhì)量和身份保持能力。
        • 支持無調(diào)優(yōu)定制化:為無調(diào)優(yōu)方法提供數(shù)據(jù)支持,消除對每個(gè)新對象進(jìn)行昂貴優(yōu)化步驟的需求。

        SynCD的技術(shù)原理

        • 語言模型輔助提示生成(LLM-assisted Prompt Generation)
          • 使用語言模型(如LLama3)生成詳細(xì)的對象及背景場景描述。對于剛體對象,采用Cap3D提供的描述;對于可變形對象,則直接從類別名稱生成詳細(xì)描述。
          • 基于LLM生成多個(gè)背景描述,將對象描述與這些背景結(jié)合,形成多圖像的提示。
        • 共享注意力機(jī)制(Masked Shared Attention, MSA)
          • 在生成多圖像時(shí),利用Masked Shared Attention機(jī)制共享前景對象區(qū)域的特征,確保不同圖像中對象的一致性。
          • 在擴(kuò)散模型的注意力模塊中,每個(gè)圖像的特征不僅關(guān)注自身,還關(guān)注其他圖像中的對象特征,并通過掩碼忽略背景區(qū)域。
        • 3D資產(chǎn)引導(dǎo)(3D Asset Guidance)
          • 對于剛體對象,使用Objaverse中的3D資產(chǎn)進(jìn)行多視角渲染,生成深度圖和對應(yīng)的圖像。
          • 基于深度引導(dǎo)和多視角的對應(yīng)關(guān)系,進(jìn)一步增強(qiáng)對象的3D一致性,支持像素級的跨視角對應(yīng)關(guān)系,確保對象在不同視角下形狀和顏色的一致。
        • 數(shù)據(jù)過濾與質(zhì)量控制
          • 通過美學(xué)評分(aesthetic score)和對象相似性(使用DINOv2特征空間計(jì)算)過濾低質(zhì)量或不一致的圖像,確保最終數(shù)據(jù)集的高質(zhì)量。
          • 通過自動化的過濾步驟,剔除不符合要求的圖像,最終生成高質(zhì)量的合成數(shù)據(jù)集。

        SynCD的項(xiàng)目地址

        SynCD的應(yīng)用場景

        • 個(gè)性化內(nèi)容生成:用戶可以上傳個(gè)人物品或?qū)櫸镎掌Y(jié)合文本提示生成其在不同場景或風(fēng)格下的新圖像,以滿足個(gè)性化需求。
        • 創(chuàng)意設(shè)計(jì)與藝術(shù)創(chuàng)作:設(shè)計(jì)師和藝術(shù)家能夠快速生成概念圖像,驗(yàn)證設(shè)計(jì)想法或創(chuàng)作具有特定風(fēng)格的藝術(shù)作品,提高創(chuàng)意表達(dá)效率。
        • 虛擬場景構(gòu)建:在虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)中,生成虛擬場景中的特定對象,例如將虛擬角色放置在不同環(huán)境中,以增強(qiáng)沉浸感。
        • 廣告與營銷:品牌可以生成產(chǎn)品在不同使用場景或目標(biāo)受眾環(huán)境中的圖像,用于廣告宣傳,提高吸引力和說服力。
        • 教育與培訓(xùn):教育領(lǐng)域可以生成教學(xué)材料,例如將歷史文物置于古代場景中,以幫助學(xué)生更好地理解知識,提高學(xué)習(xí)效果。

        常見問題

        • SynCD數(shù)據(jù)集的使用限制是什么?:使用SynCD數(shù)據(jù)集需遵循相關(guān)的版權(quán)和使用協(xié)議,確保不第三方權(quán)利。
        • 如何獲取SynCD數(shù)據(jù)集?:用戶可以通過項(xiàng)目官網(wǎng)或GitHub倉庫下載數(shù)據(jù)集,并查閱相關(guān)文檔以了解使用方法。
        • SynCD適合哪些應(yīng)用領(lǐng)域?:SynCD廣泛應(yīng)用于個(gè)性化內(nèi)容生成、創(chuàng)意設(shè)計(jì)、虛擬現(xiàn)實(shí)、廣告營銷以及教育培訓(xùn)等多個(gè)領(lǐng)域。
        • 如何評價(jià)SynCD生成圖像的質(zhì)量?:SynCD采用美學(xué)評分和對象相似性評估來過濾低質(zhì)量圖像,確保生成圖像的高質(zhì)量和一致性。
        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲午夜未满十八勿入| 好吊妞在线成人免费| 亚洲人成色77777在线观看大| 中文字幕亚洲精品| 日韩免费人妻AV无码专区蜜桃 | 中文在线观看永久免费| 亚洲国产精品一区二区九九 | 一个人看www在线高清免费看| 91在线亚洲精品专区| 中文字幕在线免费观看| 亚洲国产福利精品一区二区| 免费观看的毛片大全| 在线亚洲午夜片AV大片| 在线免费观看韩国a视频| 120秒男女动态视频免费| 亚洲成aⅴ人片在线观| 成年女人毛片免费播放人| 国产精品无码亚洲一区二区三区| 麻豆成人精品国产免费| 麻豆安全免费网址入口| 久久久久久a亚洲欧洲aⅴ| 亚洲免费电影网站| 亚洲1区2区3区精华液| 中文字幕第一页亚洲| 免费国产在线视频| 亚洲宅男精品一区在线观看| 国产乱弄免费视频| 成全高清在线观看免费| 亚洲中文无码a∨在线观看| 国产一级淫片免费播放| 中文字幕乱码一区二区免费| 亚洲春黄在线观看| 免费国产真实迷j在线观看| 免费人成毛片动漫在线播放| 亚洲a∨无码男人的天堂| 亚洲成av人片一区二区三区| 特级无码毛片免费视频尤物| 亚洲国产精品无码第一区二区三区| 亚洲日韩人妻第一页| 四虎在线免费视频| 精品久久久久久无码免费|