擴(kuò)散模型攻克算法難題,AGI不遠(yuǎn)了!谷歌大腦找到迷宮最短路徑
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:擴(kuò)散模型攻克算法難題,AGI不遠(yuǎn)了!谷歌大腦找到迷宮最短路徑
關(guān)鍵字:模型,圖像,迷宮,算法,路徑
文章來(lái)源:新智元
內(nèi)容字?jǐn)?shù):3152字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】解決最短路徑算法,也能被擴(kuò)散模型完成。「擴(kuò)散模型」也能攻克算法難題?
一位博士研究人員做了一個(gè)有趣的實(shí)驗(yàn),用「離散擴(kuò)散」尋找用圖像表示的迷宮中的最短路徑。
作者介紹,每個(gè)迷宮都是通過(guò)反復(fù)添加水平和垂直墻生成的。
其中,起始點(diǎn)和目標(biāo)點(diǎn)隨機(jī)選取。
從起點(diǎn)到目標(biāo)點(diǎn)的最短路徑中,隨機(jī)采樣一條作為解決方案的路徑。最短路徑是通過(guò)精確算法算出來(lái)的。
然后使用離散擴(kuò)散模型和U-Net。
將起點(diǎn)和目標(biāo)的迷宮被編碼在一個(gè)通道中,而模型在另一個(gè)通道中用解來(lái)消除迷宮的噪聲。
再難一點(diǎn)的迷宮,也能做的很好。
為了估算去噪步驟 p(x_{t-1} | x_t),算估算 p(x_0 | x_t)。在這個(gè)過(guò)程中可視化這一估計(jì)值(底行),顯示「當(dāng)前假設(shè)」,最終聚焦在結(jié)果上。
英偉達(dá)高級(jí)科學(xué)家Jim Fan表示,這是一個(gè)有趣的實(shí)驗(yàn),擴(kuò)散模型可以「渲染」算法。它可以僅從像素實(shí)現(xiàn)迷宮遍歷,甚至使用了比Transforme弱得多的U-Net。
我一直認(rèn)為擴(kuò)散模型是渲染器,而Transformer是推理引擎。看起來(lái),渲染器本身也可以編碼非常復(fù)雜的順序算法。
這個(gè)實(shí)驗(yàn)簡(jiǎn)直驚呆了網(wǎng)友,「擴(kuò)散
原文鏈接:擴(kuò)散模型攻克算法難題,AGI不遠(yuǎn)了!谷歌大腦找到迷宮最短路徑
聯(lián)系作者
文章來(lái)源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國(guó)新智能時(shí)代。