何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型，最后竟成經(jīng)典去噪自編碼器

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布機(jī)器之心

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型，最后竟成經(jīng)典去噪自編碼器
關(guān)鍵字：噪聲,模型,表征,編碼器,圖像
文章來(lái)源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：11726字

內(nèi)容摘要：

機(jī)器之心報(bào)道
編輯：Panda去噪擴(kuò)散模型（DDM）是當(dāng)前圖像生成技術(shù)的一大主流方法。近日，Xinlei Chen、Zhuang Liu、謝賽寧與何愷明四人團(tuán)隊(duì)對(duì) DDM 進(jìn)行了解構(gòu)研究 —— 通過(guò)層層剝離其組件，DDM 的生成能力不斷下降，但其表征學(xué)習(xí)能力卻能得到一定的維持。這表明 DDM 的某些組件可能對(duì)表征學(xué)習(xí)作用不大。
對(duì)于當(dāng)前計(jì)算機(jī)視覺(jué)等領(lǐng)域的生成模型，去噪是一種核心方法。這類(lèi)方法常被稱(chēng)為去噪擴(kuò)散模型（DDM）—— 它們會(huì)學(xué)習(xí)一個(gè)去噪自動(dòng)編碼器（DAE），其能通過(guò)一個(gè)擴(kuò)散過(guò)程移除多個(gè)層級(jí)的噪聲。
這些方法實(shí)現(xiàn)了出色的圖像生成質(zhì)量，尤其適合生成高分辨率、類(lèi)似照片的仿真實(shí)圖像。事實(shí)上，這些生成模型的表現(xiàn)如此之好，以至于看起來(lái)它們就好像具有強(qiáng)大的識(shí)別表征，可以理解這些視覺(jué)內(nèi)容。
盡管 DAE 是當(dāng)今生成模型的中流砥柱，但提出這種方法的最早論文《Extracting and composing robust features with denoising autoencoders》卻是為了以監(jiān)督式方法從數(shù)據(jù)學(xué)習(xí)表征。
在當(dāng)今的表征學(xué)習(xí)社區(qū)，可以說(shuō) DAE 最成功的變體都是基于「掩碼噪

原文鏈接：何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型，最后竟成經(jīng)典去噪自編碼器