探索未來(lái):LeCun團(tuán)隊(duì)揭示世界模型導(dǎo)航的性進(jìn)展
原標(biāo)題:圖靈獎(jiǎng)得主LeCun團(tuán)隊(duì)新作:在世界模型中導(dǎo)航
文章來(lái)源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):13399字
世界模型研究的新進(jìn)展
隨著 AI 領(lǐng)域的不斷發(fā)展,世界模型(World Models)已經(jīng)成為熱門(mén)的研究方向。近期,Meta FAIR 的 Yann LeCun 團(tuán)隊(duì)發(fā)布了名為導(dǎo)航世界模型(Navigation World Models/NWM)的新研究成果,其目標(biāo)是提升導(dǎo)航能力,并在復(fù)雜環(huán)境中進(jìn)行路徑規(guī)劃。
NWM 的核心能力
NWM 能夠基于單張輸入圖像生成連續(xù)且一致的視頻。這一過(guò)程是自回歸的,意味著模型可以根據(jù)已有圖像預(yù)測(cè)未來(lái)狀態(tài)。NWM 具備在已知環(huán)境中按照軌跡行進(jìn)的能力,同時(shí)也能在未知環(huán)境中自主尋找前進(jìn)路徑,展現(xiàn)出強(qiáng)大的導(dǎo)航能力。
技術(shù)細(xì)節(jié)與創(chuàng)新
LeCun 團(tuán)隊(duì)的研究提出了一種全新的條件擴(kuò)散 Transformer(CDiT),該模型可以高效地?cái)U(kuò)展到 1B 參數(shù),同時(shí)計(jì)算需求顯著降低。NWM 的訓(xùn)練采用了來(lái)自不同機(jī)器人智能體的視頻數(shù)據(jù),使其在未見(jiàn)過(guò)的環(huán)境中也能表現(xiàn)出色。
實(shí)驗(yàn)效果與對(duì)比
實(shí)驗(yàn)表明,NWM 在視頻預(yù)測(cè)和生成質(zhì)量方面優(yōu)于其他模型,如 DIAMOND。NWM 的預(yù)測(cè)準(zhǔn)確度和生成質(zhì)量在多個(gè)指標(biāo)上均表現(xiàn)出色。特別是在規(guī)劃和帶約束條件的規(guī)劃實(shí)驗(yàn)中,NWM 能夠有效執(zhí)行目標(biāo)導(dǎo)向的導(dǎo)航任務(wù),展現(xiàn)出良好的適應(yīng)性。
未來(lái)研究方向
隨著 NWM 研究的深入,團(tuán)隊(duì)希望能進(jìn)一步提升模型在未知環(huán)境中的表現(xiàn),并對(duì)未標(biāo)注數(shù)據(jù)的利用進(jìn)行探索,以增強(qiáng)模型的泛化能力。總體而言,NWM 的推出為世界模型研究注入了新的活力,展示了 AI 在復(fù)雜任務(wù)中的潛力。
聯(lián)系作者
文章來(lái)源:人工智能學(xué)家
作者微信:
作者簡(jiǎn)介:致力成為權(quán)威的人工智能科技媒體和前沿科技研究機(jī)構(gòu)