大多數模型甚至在沒有噪聲下表現得更好~
原標題:再次顛覆學界想象,何愷明發表新作:擴散模型不一定需要噪聲條件
文章來源:智猩猩GenAI
內容字數:5917字
何愷明最新研究:去噪生成模型真的需要噪聲條件嗎?
本文總結了何愷明團隊最新研究論文的核心觀點,該研究對去噪生成模型是否需要噪聲條件這一長期假設提出了質疑。研究發現,許多模型即使在沒有噪聲條件的情況下也能表現良好,甚至更好,顛覆了以往的認知。
1. 去噪生成模型的重構與訓練目標
研究者首先對現有的去噪生成模型進行了重構,將模型訓練和采樣過程進行簡化,以便更好地分析噪聲條件的影響。他們重點關注神經網絡的輸出與回歸目標之間的關系。訓練目標的最小化,旨在最小化噪聲圖像與其真實圖像之間的差異,不同方法(iDDPM、DDIM、EDM 和 FM)的調度函數有所不同。
2. 無噪聲條件模型的理論分析
研究者對無噪聲條件下模型的行為進行了理論分析,分析了訓練階段的有效回歸目標以及單個去噪步驟和迭代采樣過程中的誤差累積。他們提出了一個誤差邊界,該邊界無需訓練,僅取決于噪聲條件和數據集。該誤差邊界與模型的實際表現高度相關,尤其是在模型出現災難性失敗的情況下,誤差邊界會顯著增高。
3. uEDM模型的提出
基于上述分析,研究者提出了一種名為uEDM的簡化模型,該模型無需噪聲條件。實驗結果表明,uEDM在CIFAR10數據集上取得了2.23的FID得分,與需要噪聲條件的模型表現差距很小。
4. 實驗結果與分析
研究者對多種去噪生成模型(包括擴散模型、基于流的模型和一致性模型)進行了實驗,結果表明:大多數模型在去除噪聲條件后仍然能夠良好運行,甚至有些模型表現更好;只有極少數模型在去除噪聲條件后出現災難性失敗;理論誤差邊界與模型的實際表現高度吻合。
5. 研究意義與未來展望
這項研究挑戰了去噪生成模型領域的一個基本假設,為該領域帶來了新的研究方向。消除噪聲條件可能為基于去噪的生成模型帶來新的突破,并促使研究者重新審視該領域的基本原理。例如,基于分數的模型只有在沒有噪聲條件的情況下才能學習到獨特的分數函數,并實現經典的基于物理學的朗格文動力學。研究結果表明,對噪聲條件的依賴可能被過度強調了,未來的研究可以探索更多無需噪聲條件的模型。
聯系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介:智猩猩旗下賬號,專注于生成式人工智能,主要分享技術文章、論文成果與產品信息。
相關文章
