国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

謝賽寧新作爆火，擴散模型新賽道誕生！測試時計算帶飛，性能飆到天花板

AIGC動態(tài)11個月前發(fā)布新智元

398 0 0

謝賽寧新作爆火，擴散模型新賽道誕生！測試時計算帶飛，性能飆到天花板

原標(biāo)題：謝賽寧新作爆火，擴散模型新賽道誕生！測試時計算帶飛，性能飆到天花板
文章來源：新智元
內(nèi)容字數(shù)：9400字

擴散模型測試時計算Scaling Law的突破性研究

來自紐約大學(xué)、麻省理工學(xué)院和谷歌的頂尖研究團隊，在擴散模型（DM）的測試時計算Scaling Law方面取得了突破性進展。該研究由謝賽寧教授團隊參與，其成果引發(fā)了廣泛關(guān)注。

1. 研究背景： 大模型的測試時計算Scaling Law是當(dāng)前AI領(lǐng)域的研究熱點，OpenAI的成果o3已證明其有效性。然而，擴散模型在推理階段增加去噪步驟后，性能提升往往會很快遇到瓶頸，限制了其Scaling能力。

2. 創(chuàng)新方法：該研究將推理時Scaling重新定義為對采樣噪聲的搜索問題。研究人員提出了一種創(chuàng)新的搜索框架，包含兩個核心要素：驗證器和算法。

a. 驗證器： 預(yù)訓(xùn)練模型，用于評估噪聲候選項的質(zhì)量，提供反饋。研究中使用了三種類型的驗證器：預(yù)言驗證器（Oracle Verifier）、監(jiān)督驗證器（Supervised Verifier）和自監(jiān)督驗證器（Self-Supervised Verifier）。

b. 算法： 基于驗證器反饋，尋找更優(yōu)噪聲候選項的函數(shù)。研究中使用了隨機搜索、零階搜索和路徑搜索三種算法。

3. 實驗結(jié)果： 研究人員在ImageNet和DrawBench等數(shù)據(jù)集上進行了實驗，結(jié)果表明，該搜索框架能夠顯著提升擴散模型的生成性能，超越了僅僅增加去噪步驟的效果。不同驗證器和算法的組合展現(xiàn)出不同的Scaling特性，沒有單一最優(yōu)配置，需要根據(jù)具體任務(wù)選擇合適的設(shè)置。

4. 小模型的優(yōu)勢： 研究還發(fā)現(xiàn)，通過測試時計算Scaling，較小的擴散模型也能在有限的推理預(yù)算下取得優(yōu)于更大模型的性能。這表明，大量的訓(xùn)練成本可以通過適度的推理時計算來部分抵消，從而更有效地獲得高質(zhì)量樣本。

5. 主要貢獻：

a. 提出了一個用于擴散模型推理時Scaling的基礎(chǔ)框架。

b. 確定了搜索框架中的兩個關(guān)鍵設(shè)計軸：驗證器和算法。

c. 對驗證器與不同生成任務(wù)之間的對齊進行了廣泛分析。

6. 未來展望： 謝賽寧教授認為，2025年擴散模型的發(fā)展方向是“要么（非常）小，要么（非常）大”，該研究為這兩個方向都提供了新的可能性。

7. 團隊成員： 共同一作Willis(Nanye) Ma是謝賽寧教授的博士生，也是谷歌的學(xué)生研究員；另一位共同一作Shangyuan Tong是麻省理工學(xué)院CSAIL的博士生。

總而言之，這項研究為擴散模型的測試時計算Scaling Law開辟了新的方向，為高效生成高質(zhì)量樣本提供了新的途徑，具有重要的理論和實踐意義。

聯(lián)系作者

文章來源：新智元
作者微信：
作者簡介：智能+中國主平臺，致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點關(guān)注人工智能、機器人等前沿領(lǐng)域發(fā)展，關(guān)注人機融合、人工智能和機器人對人類社會與文明進化的影響，領(lǐng)航中國新智能時代。

閱讀原文