伯克利羅劍嵐：機(jī)器人的范式，藏在真實(shí)世界中丨具身先鋒十人談

AIGC動(dòng)態(tài)6個(gè)月前發(fā)布 AI科技評(píng)論

伯克利羅劍嵐：機(jī)器人的范式革命，藏在真實(shí)世界中丨具身先鋒十人談

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：伯克利羅劍嵐：機(jī)器人的范式，藏在真實(shí)世界中丨具身先鋒十人談
關(guān)鍵字：機(jī)器人,模型,數(shù)據(jù),問題,世界
文章來源：AI科技評(píng)論
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

Sergey Levine 對(duì)羅劍嵐說，“You really made RL work.”作者丨賴文昕
編輯丨陳彩嫻
近日，伯克利大學(xué) Sergey Levine 團(tuán)隊(duì)發(fā)布了一項(xiàng)強(qiáng)化學(xué)習(xí)方向的重磅工作——HIL-SERL，引起了具身智能領(lǐng)域的廣泛討論與關(guān)注。
根據(jù)實(shí)驗(yàn)結(jié)果，基于強(qiáng)化學(xué)習(xí)框架 HIL-SERL，研究者可以直接在現(xiàn)實(shí)世界中訓(xùn)練基于視覺的通用機(jī)器人操作策略。其中，機(jī)器人經(jīng)過 1~2.5 小時(shí)的訓(xùn)練后，就能完成主板、儀表盤以及正時(shí)皮帶組裝等操作任務(wù)。
而且，機(jī)器人完成所有任務(wù)的成功率均高達(dá) 100%！
這些任務(wù)包括組裝家具、顛勺煎蛋、鞭打積木、插入 U 盤等操作，即使在人為干擾的情況下，機(jī)器人也依舊能夠穩(wěn)定、靈活地完成任務(wù)。
此前，強(qiáng)化學(xué)習(xí)（RL）總是被業(yè)內(nèi)人士詬病其只能在模擬環(huán)境中改進(jìn)算法性能，無法解決現(xiàn)實(shí)世界里真實(shí)機(jī)器人的問題。但 SERL 系列的工作證明，真機(jī) RL 不是天方夜譚——如今，強(qiáng)化學(xué)習(xí)不僅能應(yīng)用在現(xiàn)實(shí)世界中，且在精準(zhǔn)靈巧的操作任務(wù)上效果極佳，且遠(yuǎn)超模仿學(xué)習(xí)方法，節(jié)拍數(shù)也平均快了 1.8 倍。
換言之，SERL 是真機(jī) RL 機(jī)器人領(lǐng)域的一個(gè)劃時(shí)代工作。而這個(gè)

原文鏈接：伯克利羅劍嵐：機(jī)器人的范式，藏在真實(shí)世界中丨具身先鋒十人談