中山大學(xué)與聯(lián)想團(tuán)隊(duì)發(fā)布 ConsistentID,單張照片即可成為百變超人

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:中山大學(xué)與聯(lián)想團(tuán)隊(duì)發(fā)布 ConsistentID,單張照片即可成為百變超人
關(guān)鍵字:面部,方法,圖像,模型,特征
文章來源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):5790字
內(nèi)容摘要:
上傳一張個(gè)人照片就能瞬間變換身份,這不再是科幻片中的情節(jié)。最近,圖像生成技術(shù)經(jīng)歷了顯著的進(jìn)化,這是由基于擴(kuò)散的, 文本到圖像大型模型的出現(xiàn)和進(jìn)步驅(qū)動(dòng)的,如GLIDE 、DALL-E 2 、Imagen、穩(wěn)定擴(kuò)散(SD)、eDiff-I 和 RAPHAEL。
這一進(jìn)展催生了跨不同場(chǎng)景的大量應(yīng)用方法。作為這些應(yīng)用方法的中心焦點(diǎn),個(gè)性化和定制的肖像生成在學(xué)術(shù)和工業(yè)領(lǐng)域都引起了廣泛關(guān)注,因?yàn)樗陔娮由虅?wù)廣告、個(gè)性化禮物定制和虛擬試穿等下游任務(wù)中具有廣泛的適用性。
然而,定制化面部生成的主要挑戰(zhàn)是基于一個(gè)或多個(gè)參考圖像保持不同屬性的面部圖像一致性,導(dǎo)致兩個(gè)關(guān)鍵問題:確保準(zhǔn)確的身份(ID)一致性并實(shí)現(xiàn)高保真、多樣化的面部細(xì)節(jié)。
當(dāng)前的文本到圖像模型,盡管結(jié)合了結(jié)構(gòu)和內(nèi)容指導(dǎo),但在精確控制個(gè)性化和定制生成方面面臨限制,特別是在生成的圖像對(duì)參考圖像的保真度方面。
近日,中山大合聯(lián)想團(tuán)隊(duì)發(fā)布 ConsistentID,重新構(gòu)建了一批50萬(wàn)的多模態(tài)細(xì)粒度 ID 數(shù)據(jù)集用于訓(xùn)練提出的 FacialEncoder 模型,可支持個(gè)性化寫真,性別/年齡更改,身份混淆等常見功能。
論文地址:http://arx
原文鏈接:中山大學(xué)與聯(lián)想團(tuán)隊(duì)發(fā)布 ConsistentID,單張照片即可成為百變超人
聯(lián)系作者
文章來源:AI科技評(píng)論
作者微信:aitechtalk
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。

粵公網(wǎng)安備 44011502001135號(hào)