一文看盡297篇文獻！中科院領(lǐng)銜發(fā)表首篇「基于擴散模型的圖像編輯」綜述

AIGC動態(tài)1年前 (2024)發(fā)布新智元

AIGC動態(tài)歡迎閱讀

原標題：一文看盡297篇文獻！中科院領(lǐng)銜發(fā)表首篇「基于擴散模型的圖像編輯」綜述
關(guān)鍵字：模型,方法,圖像,圖像編輯,編輯
文章來源：新智元
內(nèi)容字數(shù)：19882字

內(nèi)容摘要：

新智元報道編輯：LRS
【新智元導讀】AIGC大模型最火熱的任務(wù)之一——基于Diffusion Model的圖像編輯（editing）領(lǐng)域的首篇綜述，長達26頁，涵蓋297篇文獻！本文全面研究圖像編輯前沿方法，并根據(jù)技術(shù)路線精煉地劃分為3個大類、14個子類，通過表格列明每個方法的類型、條件、可執(zhí)行任務(wù)等信息。
此外，本文提出了一個全新benchmark以及LMM Score指標來對代表性方法進行實驗評估，為研究者提供了便捷的學習參考工具。強烈推薦AIGC大模型研究者或愛好者閱讀，緊跟熱點。論文地址：https://arxiv.org/abs/2402.17525
開源項目：https://github.com/SiatMMLab/Awesome-Diffusion-Model-Based-Image-Editing-Methods
摘要去噪擴散模型已成為各種圖像生成和編輯任務(wù)的有力工具，有助于以無條件或輸入條件的方式合成視覺內(nèi)容。
這些模型背后的核心理念是學習如何逆轉(zhuǎn)逐漸向圖像中添加噪聲的過程，從而從復雜的分布中生成高質(zhì)量的樣本。
在這份調(diào)查報告中，我們詳盡概述了使用擴散模型進行圖像

原文鏈接：一文看盡297篇文獻！中科院領(lǐng)銜發(fā)表首篇「基于擴散模型的圖像編輯」綜述

聯(lián)系作者

文章來源：新智元
作者微信：AI_era
作者簡介：智能+中國主平臺，致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展，關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響，領(lǐng)航中國新智能時代。

閱讀原文