何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型,最后竟成經(jīng)典去噪自編碼器
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型,最后竟成經(jīng)典去噪自編碼器
關(guān)鍵字:噪聲,模型,表征,編碼器,圖像
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):11726字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:Panda去噪擴(kuò)散模型(DDM)是當(dāng)前圖像生成技術(shù)的一大主流方法。近日,Xinlei Chen、Zhuang Liu、謝賽寧與何愷明四人團(tuán)隊(duì)對(duì) DDM 進(jìn)行了解構(gòu)研究 —— 通過(guò)層層剝離其組件,DDM 的生成能力不斷下降,但其表征學(xué)習(xí)能力卻能得到一定的維持。這表明 DDM 的某些組件可能對(duì)表征學(xué)習(xí)作用不大。
對(duì)于當(dāng)前計(jì)算機(jī)視覺(jué)等領(lǐng)域的生成模型,去噪是一種核心方法。這類(lèi)方法常被稱(chēng)為去噪擴(kuò)散模型(DDM)—— 它們會(huì)學(xué)習(xí)一個(gè)去噪自動(dòng)編碼器(DAE),其能通過(guò)一個(gè)擴(kuò)散過(guò)程移除多個(gè)層級(jí)的噪聲。
這些方法實(shí)現(xiàn)了出色的圖像生成質(zhì)量,尤其適合生成高分辨率、類(lèi)似照片的仿真實(shí)圖像。事實(shí)上,這些生成模型的表現(xiàn)如此之好,以至于看起來(lái)它們就好像具有強(qiáng)大的識(shí)別表征,可以理解這些視覺(jué)內(nèi)容。
盡管 DAE 是當(dāng)今生成模型的中流砥柱,但提出這種方法的最早論文《Extracting and composing robust features with denoising autoencoders》卻是為了以監(jiān)督式方法從數(shù)據(jù)學(xué)習(xí)表征。
在當(dāng)今的表征學(xué)習(xí)社區(qū),可以說(shuō) DAE 最成功的變體都是基于「掩碼噪
原文鏈接:何愷明謝賽寧團(tuán)隊(duì)步步解構(gòu)擴(kuò)散模型,最后竟成經(jīng)典去噪自編碼器
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)