新擴散模型OmniGen一統圖像生成，架構還高度簡化、易用

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：新擴散模型OmniGen一統圖像生成，架構還高度簡化、易用
關鍵字：圖像,模型,能力,報告,任務
文章來源：機器之心
內容字數：0字

內容摘要：

機器之心發布
機器之心編輯部大型語言模型（LLM）的出現統一了語言生成任務，并徹底改變了人機交互。然而，在圖像生成領域，能夠在單一框架內處理各種任務的統一模型在很大程度上仍未得到探索。近日，智源推出了新的擴散模型架構 OmniGen，一種新的用于統一圖像生成的多模態模型。
OmniGen 具有以下特點：
統一性：OmniGen 天然地支持各種圖像生成任務，例如文生圖、圖像編輯、主題驅動生成和視覺條件生成等。此外，OmniGen 可以處理經典的計算機視覺任務，將其轉換為圖像生成任務。
簡單性：OmniGen 的架構高度簡化。此外，與現有模型相比，它更加用戶友好，可以通過指令完成復雜的任務，而不需要冗長的處理步驟和額外的模塊 (如 ControlNet 或 IP-Adapter)，從而大大簡化了工作流程。
知識遷移：受益于統一格式的學習，OmniGen 有效地跨不同任務遷移知識，應對未見過的任務和領域，并展示新穎的功能。我們還探討了模型的推理能力和思維鏈機制的在圖像生成領域的潛在應用。Paper: https://arxiv.org/pdf/2409.11340
Code: https:/

原文鏈接：新擴散模型OmniGen一統圖像生成，架構還高度簡化、易用