AIGC動態歡迎閱讀
原標題:今日arXiv最熱大模型論文:復旦提出基于diffusion的虛擬試衣模型,模特一鍵換裝
關鍵字:衣物,圖像,特征,服裝,細節
文章來源:夕小瑤科技說
內容字數:5362字
內容摘要:
夕小瑤科技說 原創作者 | 謝年年僅需上傳模特圖像,便可一鍵換裝,極大提高了用戶網購衣服的效率。
虛擬試衣(Virtual Try-On)作為圖像生成中一個商業價值高、可以直接變現的子任務,研究熱度隨著圖像生成技術的發展水漲船高。
但現有的一些方法生成的效果還差點意思,如下圖所示:
基于GAN的方法換裝后與模特不貼合,像是簡單粗暴P上去的一樣。擴散模型的出現使其可以生成逼真的試穿圖像,但它們往往在細節上還原度不高,比如衣服的色彩版型與原始平裝衣物不一致。
復旦團隊認為擴散模型的隨機性和潛在監督不足是導致問題的關鍵因素。為了緩解這些問題,作者為虛擬試衣(VTON)任務提出了一種新穎的忠實潛在擴散模型——FLDM-VTON。
該方法在傳統的潛在擴散過程的訓練中從兩個主要方面進行了改進:(i) 通過利用變形后的衣物作為起點和局部條件,提供忠實的衣物先驗,以減輕初始和過程中的隨機性,(ii)通過一個新穎的衣物平坦化網絡,從原始平裝衣物引入額外的圖像級約束。結果顯示,FLDM-VTON在性能上超越了最先進的基線,能夠生成具有真實照片級逼真度和忠實衣物細節的試穿圖像。
論文標題:FLDM-VTON
原文鏈接:今日arXiv最熱大模型論文:復旦提出基于diffusion的虛擬試衣模型,模特一鍵換裝
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189