「個性化」圖像生成時代來了！六大頂尖高校聯手發布全新Gen4Gen框架

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：「個性化」圖像生成時代來了！六大頂尖高校聯手發布全新Gen4Gen框架
關鍵字：圖像,概念,數據,研究人員,模型
文章來源：新智元
內容字數：7507字

內容摘要：

新智元報道編輯：LRS
【新智元導讀】文中提出了一個半自動數據集創建管道Gen4Gen，將個性化概念與文本描述結合成復雜的組合，創建了基準測試數據集MyCanvas，利用CP-CLIP 和 TI-CLIP指標證明了該方法的有效性。過去幾年里，基于文本來生成圖像的擴散模型得到了飛速發展，生成能力有了顯著的提升，可以很容易地生成逼真的肖像畫，以及各種天馬行空的奇幻畫作。
近期的相關研究主要集中在控制模型生成「個性化」的內容，即用戶先提供一個最小概念圖像集，然后對預訓練的文本轉圖像擴散模型進行增強，從而使模型可以生成包含個性化概念的新場景。
現有的一些工作可以增強用戶對生成過程的控制，并衍生出許多量身定制的應用場景；但要同時對多個概念進行個性化處理，并控制圖像生成以準確遵循給定的文本描述，仍然具有挑戰性。
最近，來自加州大學伯克利分校、牛津大學、哈佛大學、卡內基梅隆大學、香港大學、加州大學戴維斯分校的研究人員聯合發表了一篇論文，討論了「圖像生成個性化」領域下的兩個關鍵問題。
論文鏈接：https://arxiv.org/abs/2402.15504
項目主頁：https://danielc

原文鏈接：「個性化」圖像生成時代來了！六大頂尖高校聯手發布全新Gen4Gen框架