打入AI底層!NUS尤洋團(tuán)隊(duì)用擴(kuò)散模型構(gòu)建神經(jīng)網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:打入AI底層!NUS尤洋團(tuán)隊(duì)用擴(kuò)散模型構(gòu)建神經(jīng)網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊
關(guān)鍵字:模型,騰訊,神經(jīng)網(wǎng)絡(luò),參數(shù),噪聲
文章來源:量子位
內(nèi)容字?jǐn)?shù):3666字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI擴(kuò)散模型,迎來了一項(xiàng)重大新應(yīng)用——
像Sora生成視頻一樣,給神經(jīng)網(wǎng)絡(luò)生成參數(shù),直接打入了AI的底層!
這就是新加坡國立大學(xué)尤洋教授團(tuán)隊(duì)聯(lián)合UCB、Meta AI實(shí)驗(yàn)室等機(jī)構(gòu)最新開源的研究成果。
具體來說,研究團(tuán)隊(duì)提出了一種用于生成神經(jīng)網(wǎng)絡(luò)參數(shù)的擴(kuò)散模型p(arameter)-diff。
用它來生成網(wǎng)絡(luò)參數(shù),速度比直接訓(xùn)練最多提高44倍,而且表現(xiàn)毫不遜色。
這一模型一經(jīng)發(fā)布,就迅速在AI社區(qū)引發(fā)強(qiáng)烈討論,圈內(nèi)人士對此的驚嘆,毫不亞于普通人看到Sora時(shí)的反應(yīng)。
甚至有人直接驚呼,這基本上相當(dāng)于AI在創(chuàng)造新的AI了。
就連AI巨頭LeCun看了之后,也點(diǎn)贊了這一成果,表示這真的是個(gè)cute idea。
而實(shí)質(zhì)上,p-diff也確實(shí)具有和Sora一樣重大的意義,對此同實(shí)驗(yàn)室的Fuzhao Xue(薛復(fù)昭)博士進(jìn)行了詳細(xì)解釋:
Sora生成高維數(shù)據(jù),即視頻,這使得Sora成為世界模擬器(從一個(gè)維度接近AGI)。
而這項(xiàng)工作,神經(jīng)網(wǎng)絡(luò)擴(kuò)散,可以生成模型中的參數(shù),具有成為元世界級學(xué)習(xí)器/優(yōu)化器的潛力,從另一個(gè)新的重要維度向AGI邁進(jìn)。
言歸正傳
原文鏈接:打入AI底層!NUS尤洋團(tuán)隊(duì)用擴(kuò)散模型構(gòu)建神經(jīng)網(wǎng)絡(luò)參數(shù),LeCun點(diǎn)贊
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破