謝賽寧新作爆火,擴散模型新賽道誕生!測試時計算帶飛,性能飆到天花板
原標題:謝賽寧新作爆火,擴散模型新賽道誕生!測試時計算帶飛,性能飆到天花板
文章來源:新智元
內(nèi)容字數(shù):9400字
擴散模型測試時計算Scaling Law的突破性研究
來自紐約大學、麻省理工學院和谷歌的頂尖研究團隊,在擴散模型(DM)的測試時計算Scaling Law方面取得了突破性進展。該研究由謝賽寧教授團隊參與,其成果引發(fā)了廣泛關(guān)注。
1. 研究背景: 大模型的測試時計算Scaling Law是當前AI領(lǐng)域的研究熱點,OpenAI的成果o3已證明其有效性。然而,擴散模型在推理階段增加去噪步驟后,性能提升往往會很快遇到瓶頸,限制了其Scaling能力。
2. 創(chuàng)新方法:該研究將推理時Scaling重新定義為對采樣噪聲的搜索問題。研究人員提出了一種創(chuàng)新的搜索框架,包含兩個核心要素:驗證器和算法。
a. 驗證器: 預(yù)訓(xùn)練模型,用于評估噪聲候選項的質(zhì)量,提供反饋。研究中使用了三種類型的驗證器:預(yù)言驗證器(Oracle Verifier)、監(jiān)督驗證器(Supervised Verifier)和自監(jiān)督驗證器(Self-Supervised Verifier)。
b. 算法: 基于驗證器反饋,尋找更優(yōu)噪聲候選項的函數(shù)。研究中使用了隨機搜索、零階搜索和路徑搜索三種算法。
3. 實驗結(jié)果: 研究人員在ImageNet和DrawBench等數(shù)據(jù)集上進行了實驗,結(jié)果表明,該搜索框架能夠顯著提升擴散模型的生成性能,超越了僅僅增加去噪步驟的效果。不同驗證器和算法的組合展現(xiàn)出不同的Scaling特性,沒有單一最優(yōu)配置,需要根據(jù)具體任務(wù)選擇合適的設(shè)置。
4. 小模型的優(yōu)勢: 研究還發(fā)現(xiàn),通過測試時計算Scaling,較小的擴散模型也能在有限的推理預(yù)算下取得優(yōu)于更大模型的性能。這表明,大量的訓(xùn)練成本可以通過適度的推理時計算來部分抵消,從而更有效地獲得高質(zhì)量樣本。
5. 主要貢獻:
a. 提出了一個用于擴散模型推理時Scaling的基礎(chǔ)框架。
b. 確定了搜索框架中的兩個關(guān)鍵設(shè)計軸:驗證器和算法。
c. 對驗證器與不同生成任務(wù)之間的對齊進行了廣泛分析。
6. 未來展望: 謝賽寧教授認為,2025年擴散模型的發(fā)展方向是“要么(非常)小,要么(非常)大”,該研究為這兩個方向都提供了新的可能性。
7. 團隊成員: 共同一作Willis(Nanye) Ma是謝賽寧教授的博士生,也是谷歌的學生研究員;另一位共同一作Shangyuan Tong是麻省理工學院CSAIL的博士生。
總而言之,這項研究為擴散模型的測試時計算Scaling Law開辟了新的方向,為高效生成高質(zhì)量樣本提供了新的途徑,具有重要的理論和實踐意義。
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展,關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響,領(lǐng)航中國新智能時代。