用MoE橫掃99個(gè)子任務(wù)!浙大等提出全新通用機(jī)器人策略GeRM
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用MoE橫掃99個(gè)子任務(wù)!浙大等提出全新通用機(jī)器人策略GeRM
關(guān)鍵字:數(shù)據(jù),機(jī)器人,任務(wù),模型,方法
文章來源:新智元
內(nèi)容字?jǐn)?shù):6420字
內(nèi)容摘要:
新智元報(bào)道編輯:LRS
【新智元導(dǎo)讀】本文分享論文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大學(xué)和浙江大合提出一種基于混合專家模型進(jìn)行強(qiáng)化學(xué)習(xí)的通用機(jī)器人策略。多任務(wù)機(jī)器人學(xué)習(xí)在應(yīng)對(duì)多樣化和復(fù)雜情景方面具有重要意義。然而,當(dāng)前的方法受到性能問題和收集訓(xùn)練數(shù)據(jù)集的困難的限制。
這篇論文提出了GeRM(通用機(jī)器人模型),研究人員利用離線強(qiáng)化學(xué)習(xí)來優(yōu)化數(shù)據(jù)利用策略,從演示和次優(yōu)數(shù)據(jù)中學(xué)習(xí),從而超越了人類演示的局限性。作者:宋文軒,趙晗,丁鵬翔,崔燦,呂尚可,范亞凝,王東林
單位:西湖大學(xué)、浙江大學(xué)
論文地址:https://arxiv.org/abs/2403.13358
項(xiàng)目地址:https://songwxuan.github.io/GeRM/
之后采用基于Transformer的視覺-語言-動(dòng)作模型來處理多模態(tài)輸入并輸出動(dòng)作。
通過引入專家混合結(jié)構(gòu),GeRM實(shí)現(xiàn)了更快的推理速度和更高的整體模型容量,從而解決了強(qiáng)化學(xué)習(xí)參數(shù)量受限的問題,提高了多任務(wù)學(xué)習(xí)中的模型性能,
原文鏈接:用MoE橫掃99個(gè)子任務(wù)!浙大等提出全新通用機(jī)器人策略GeRM
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡(jiǎn)介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。