AIGC動態歡迎閱讀
原標題:比Flux更強大的文生圖模型來了!秘訣是“集百家之長”
關鍵字:模型,研究人員,圖像,方面,框架
文章來源:量子位
內容字數:0字
內容摘要:
IterComp團隊 投稿量子位 | 公眾號 QbitAI打造更強大文生圖模型新思路有——
面對Flux、stable diffusion、Omost等爆火模型,有人開始主打“集各家所長”。
具體來說,清北、牛津、普林斯頓等機構的研究者提出了?個全新文生圖框架IterComp。
它能提取不同模型在各自領域的優勢,同時不引入額外的復雜指令或增加計算開銷。
論文一經發布,即在??(前)獲得AI論文領域大V轉發,吸引大量關注。
那么,研究人員具體是如何實現的呢?
全新文生圖框架:IterComp?2022年以來,基于diffusion的文生圖模型取得了快速發展,尤其在復雜組合生成(complex/compositional generation)任務上取得了顯著進展。
例如,今年8月發布的Flux展現出了十分震撼的復雜場景生成能力與美學質量;
RPG通過MLLM的輔助,將復雜的組合生成任務分解為簡單子任務;
InstanceDiffusion通過布局控制(layoutbased),實現了與布局分布高度一致的精確圖像生成。
然而,這些模型的優勢僅限于某些特定的組合生成任務,且存在諸多局限。
原文鏈接:比Flux更強大的文生圖模型來了!秘訣是“集百家之長”
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...