一個模型走天下!智源提出全新擴(kuò)散架構(gòu)OmniGen,AI生圖進(jìn)入「一鍵生成」時代
AIGC動態(tài)歡迎閱讀
原標(biāo)題:一個模型走天下!智源提出全新擴(kuò)散架構(gòu)OmniGen,AI生圖進(jìn)入「一鍵生成」時代
關(guān)鍵字:圖像,模型,能力,報告,任務(wù)
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報道編輯:編輯部 HYZ
【新智元導(dǎo)讀】LLM統(tǒng)一了語言生成任務(wù),圖像生成可以嗎?就在剛剛,智源推出了全新擴(kuò)散模型架構(gòu)OmniGen,單個模型就能生成圖像,徹底告別繁瑣工作流!大語言模型(LLM)的出現(xiàn)統(tǒng)一了語言生成任務(wù),并徹底改變了人機(jī)交互。
然而,在圖像生成領(lǐng)域,能夠在單一框架內(nèi)處理各種任務(wù)的統(tǒng)一模型在很大程度上仍未得到探索。
近日,智源推出了新的擴(kuò)散模型架構(gòu)OmniGen,一種新的用于統(tǒng)一圖像生成的多模態(tài)模型。
論文地址:https://arxiv.org/pdf/2409.11340
代碼倉庫:https://github.com/VectorSpaceLab/OmniGen
Demo: https://huggingface.co/spaces/Shitao/OmniGen
OmniGen具有以下特點(diǎn):
統(tǒng)一性:OmniGen天然地支持各種圖像生成任務(wù),例如文生圖、圖像編輯、主題驅(qū)動生成和視覺條件生成等。此外,OmniGen可以處理經(jīng)典的計算機(jī)視覺任務(wù),將其轉(zhuǎn)換為圖像生成任務(wù)。
簡單性:OmniGen的架構(gòu)高度簡化。此外,與現(xiàn)有模型相比,它更加用戶友好,可以通過指令完
原文鏈接:一個模型走天下!智源提出全新擴(kuò)散架構(gòu)OmniGen,AI生圖進(jìn)入「一鍵生成」時代
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介: