機(jī)器人策略學(xué)習(xí)的Game Changer?伯克利提出Body Transformer
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:機(jī)器人策略學(xué)習(xí)的Game Changer?伯克利提出Body Transformer
關(guān)鍵字:架構(gòu),節(jié)點(diǎn),機(jī)體,機(jī)器人,注意力
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:Panda過(guò)去幾年間,Transformer 架構(gòu)已經(jīng)取得了巨大的成功,同時(shí)其也衍生出了大量變體,比如擅長(zhǎng)處理視覺(jué)任務(wù)的 Vision Transformer(ViT)。本文要介紹的 Body Transformer(BoT) 則是非常適合機(jī)器人策略學(xué)習(xí)的 Transformer 變體。
我們知道,物理智能體在執(zhí)行動(dòng)作的校正和穩(wěn)定時(shí),往往會(huì)根據(jù)其感受到的外部的位置給出空間上的響應(yīng)。比如人類(lèi)對(duì)這些的響應(yīng)回路位于脊髓神經(jīng)回路層面,它們專(zhuān)門(mén)負(fù)責(zé)單個(gè)執(zhí)行器的響應(yīng)。起校正作用的局部執(zhí)行是高效的主要因素,這對(duì)機(jī)器人來(lái)說(shuō)也尤為重要。
但之前的學(xué)習(xí)架構(gòu)通常都沒(méi)有建立傳感器和執(zhí)行器之間的空間關(guān)聯(lián)。鑒于機(jī)器人策略使用的架構(gòu)基本是為自然語(yǔ)言和計(jì)算機(jī)視覺(jué)開(kāi)發(fā)的架構(gòu),它們常常無(wú)法有效地利用機(jī)器人機(jī)體的結(jié)構(gòu)。
不過(guò),Transformer 在這方面還是頗具潛力的,已有研究表明,Transformer 可以有效地處理長(zhǎng)序列依賴關(guān)系,還能輕松地吸收大量數(shù)據(jù)。Transformer 架構(gòu)原本是為非結(jié)構(gòu)化自然語(yǔ)言處理(NLP)任務(wù)開(kāi)發(fā)的。在這些任務(wù)中(比如語(yǔ)言翻譯),輸入序列通常會(huì)被映射到
原文鏈接:機(jī)器人策略學(xué)習(xí)的Game Changer?伯克利提出Body Transformer
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: