AI畫(huà)連環(huán)畫(huà)角色更一致了!人物之間的復(fù)雜互動(dòng)也能處理|中山大學(xué)&聯(lián)想團(tuán)隊(duì)出品
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:AI畫(huà)連環(huán)畫(huà)角色更一致了!人物之間的復(fù)雜互動(dòng)也能處理|中山大學(xué)&聯(lián)想團(tuán)隊(duì)出品
關(guān)鍵字:主體,圖像,布局,主題,研究人員
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AutoStudio團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI讓AI畫(huà)漫畫(huà)角色保持一致的新研究來(lái)了!
創(chuàng)作的連環(huán)畫(huà)效果belike:
頻繁切換主體、人物之間復(fù)雜的互動(dòng)也能保持角色一致性:
上述效果來(lái)自AutoStudio,是一個(gè)由中山大學(xué)和聯(lián)想團(tuán)隊(duì)聯(lián)合提出的無(wú)需訓(xùn)練的多智能體協(xié)同框架。
AutoStudio采用基于大語(yǔ)言模型的三個(gè)智能體來(lái)處理交互,并使用基于擴(kuò)散模型的Drawer生成高質(zhì)量圖像。
實(shí)驗(yàn)中,AutoStudio無(wú)論是在定量還是定性評(píng)估中都優(yōu)于現(xiàn)有方法。AutoStudio長(zhǎng)啥樣?由于最先進(jìn)的T2I生成模型在生成令人印象深刻的單個(gè)圖像方面表現(xiàn)出了卓越的能力,研究界對(duì)更復(fù)雜的多輪交互式圖像生成工作的興趣與日俱增。
在現(xiàn)實(shí)世界的應(yīng)用中,用戶經(jīng)常需要以交互方式生成一系列圖像,其中包括各種任務(wù),如開(kāi)放式故事生成和多主體多輪編輯。
然而,目前的方法大多數(shù)要求預(yù)先定義所有輪的生成指令,并且在面對(duì)不同的用戶指令(如定制、編輯和大量交叉引用)時(shí),很難在多個(gè)主體之間保持一致性。
為了解決這些問(wèn)題,研究團(tuán)隊(duì)引入了AutoStudio,這是一個(gè)多智能體、無(wú)需訓(xùn)練的框架,具有四個(gè)特別定制的智能體,
原文鏈接:AI畫(huà)連環(huán)畫(huà)角色更一致了!人物之間的復(fù)雜互動(dòng)也能處理|中山大學(xué)&聯(lián)想團(tuán)隊(duì)出品
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破