中科院自動化所王金橋教授團隊發(fā)布!利用無掩碼擴散技術(shù)實現(xiàn)多功能時尚編輯 | 一作牛蘊方博士講座預告
AIGC動態(tài)歡迎閱讀
原標題:中科院自動化所王金橋教授團隊發(fā)布!利用無掩碼擴散技術(shù)實現(xiàn)多功能時尚編輯 | 一作牛蘊方博士講座預告
關(guān)鍵字:編輯,時尚,圖像,模型,服飾
文章來源:智猩猩GenAI
內(nèi)容字數(shù):0字
內(nèi)容摘要:
時尚圖像編輯旨在根據(jù)給定的指令修改人物的外觀。現(xiàn)有的方法通常需要輔助工具,如分割器和關(guān)鍵點提取器,缺乏靈活且統(tǒng)一的框架。此外,這些方法在能夠處理的服裝種類上也有局限性,因為大多數(shù)數(shù)據(jù)集只集中于干凈背景下的人物形象,且只包含如上衣、褲子和連衣裙等通用服飾。這使其在現(xiàn)實場景中的適用性受到限制。
對于以上問題,來自中國科學院自動化研究所的在讀博士牛蘊方與人工智能研究院等研究人員共同擴展了一個現(xiàn)有的人體生成數(shù)據(jù)集,并且提出了一種基于擴散模型的時尚編輯方法AnyDesign,實現(xiàn)了實現(xiàn)了無需掩碼的服裝編輯功能。相關(guān)論文為《AnyDesign: Versatile Area Fashion Editing via Mask-Free Diffusion》。AnyDesign是一個靈活高效的時尚圖像編輯框架。用戶無需手動創(chuàng)建掩碼,只需輸入一張人物圖像以及相應(yīng)的文本或圖像格式的提示,通過無掩碼的擴散模型,即可實現(xiàn)時尚圖像編輯。
首先,擴展了一個現(xiàn)有的人體生成數(shù)據(jù)集,以包括更廣泛的服飾種類和更復雜的背景。擴展后的數(shù)據(jù)集包含穿著多種服飾的人物形象,如上衣、褲子、連衣裙、裙子、頭飾、圍巾、鞋子、襪子和包
原文鏈接:中科院自動化所王金橋教授團隊發(fā)布!利用無掩碼擴散技術(shù)實現(xiàn)多功能時尚編輯 | 一作牛蘊方博士講座預告
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介: