AIGC動態歡迎閱讀
原標題:擴散模型進軍專業圖層,斯坦福提出LayerDiffuse實現分層擴散,效果直逼商業網站
關鍵字:圖像,模型,作者,前景,本文
文章來源:大數據文摘
內容字數:9039字
內容摘要:
大數據文摘受權轉載自將門創投
目前,視覺擴散生成模型(如Stable Diffusion等)在常規圖像生成任務上獲得了非常好的效果,但是在內容制作的專業領域,例如對圖像進行透明分層制作,現有的方法仍然缺乏這種功能。本文介紹一篇來自斯坦福大學的工作,本文提出了一種名為LayerDiffuse的新型擴散方法,LayerDiffuse允許我們大規模預訓練擴散模型來生成專業的透明圖層。
本文探索了一種“latent transparency”(隱透明度)的概念,通過將alpha通道的透明度編碼到預訓練擴散模型的隱空間流形中,并將對透明度的調節設置為對隱空間流形的偏移量。LayerDiffuse僅對基礎預訓練隱空間的分布進行了微小的修改,這樣可以保留預訓練擴散隱空間的圖像生成質量。作者表示,LayerDiffuse可以應用在多種不同的開源圖像生成模型中,來實現圖像前景/背景條件層生成、結構引導生成等復雜的功能。
此外,本文的實驗結果也表明,相比普通做法(先生成圖像再摳圖),LayerDiffuse直接生成的透明圖層圖像在大多數情況下(97%)更受用戶歡迎。并且作者還將LayerDiffuse與專
原文鏈接:擴散模型進軍專業圖層,斯坦福提出LayerDiffuse實現分層擴散,效果直逼商業網站
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...