一個模型走天下！智源提出全新擴散架構OmniGen，AI生圖進入「一鍵生成」時代

AIGC動態1年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：一個模型走天下！智源提出全新擴散架構OmniGen，AI生圖進入「一鍵生成」時代
關鍵字：圖像,模型,能力,報告,任務
文章來源：新智元
內容字數：0字

內容摘要：

新智元報道編輯：編輯部 HYZ
【新智元導讀】LLM統一了語言生成任務，圖像生成可以嗎？就在剛剛，智源推出了全新擴散模型架構OmniGen，單個模型就能生成圖像，徹底告別繁瑣工作流！大語言模型（LLM）的出現統一了語言生成任務，并徹底改變了人機交互。
然而，在圖像生成領域，能夠在單一框架內處理各種任務的統一模型在很大程度上仍未得到探索。
近日，智源推出了新的擴散模型架構OmniGen，一種新的用于統一圖像生成的多模態模型。
論文地址：https://arxiv.org/pdf/2409.11340
代碼倉庫：https://github.com/VectorSpaceLab/OmniGen
Demo: https://huggingface.co/spaces/Shitao/OmniGen
OmniGen具有以下特點：
統一性：OmniGen天然地支持各種圖像生成任務，例如文生圖、圖像編輯、主題驅動生成和視覺條件生成等。此外，OmniGen可以處理經典的計算機視覺任務，將其轉換為圖像生成任務。
簡單性：OmniGen的架構高度簡化。此外，與現有模型相比，它更加用戶友好，可以通過指令完

原文鏈接：一個模型走天下！智源提出全新擴散架構OmniGen，AI生圖進入「一鍵生成」時代