伯克利羅劍嵐:機(jī)器人的范式,藏在真實(shí)世界中丨具身先鋒十人談
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:伯克利羅劍嵐:機(jī)器人的范式,藏在真實(shí)世界中丨具身先鋒十人談
關(guān)鍵字:機(jī)器人,模型,數(shù)據(jù),問題,世界
文章來源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
Sergey Levine 對(duì)羅劍嵐說,“You really made RL work.”作者丨賴文昕
編輯丨陳彩嫻
近日,伯克利大學(xué) Sergey Levine 團(tuán)隊(duì)發(fā)布了一項(xiàng)強(qiáng)化學(xué)習(xí)方向的重磅工作——HIL-SERL,引起了具身智能領(lǐng)域的廣泛討論與關(guān)注。
根據(jù)實(shí)驗(yàn)結(jié)果,基于強(qiáng)化學(xué)習(xí)框架 HIL-SERL,研究者可以直接在現(xiàn)實(shí)世界中訓(xùn)練基于視覺的通用機(jī)器人操作策略。其中,機(jī)器人經(jīng)過 1~2.5 小時(shí)的訓(xùn)練后,就能完成主板、儀表盤以及正時(shí)皮帶組裝等操作任務(wù)。
而且,機(jī)器人完成所有任務(wù)的成功率均高達(dá) 100%!
這些任務(wù)包括組裝家具、顛勺煎蛋、鞭打積木、插入 U 盤等操作,即使在人為干擾的情況下,機(jī)器人也依舊能夠穩(wěn)定、靈活地完成任務(wù)。
此前,強(qiáng)化學(xué)習(xí)(RL)總是被業(yè)內(nèi)人士詬病其只能在模擬環(huán)境中改進(jìn)算法性能,無法解決現(xiàn)實(shí)世界里真實(shí)機(jī)器人的問題。但 SERL 系列的工作證明,真機(jī) RL 不是天方夜譚——如今,強(qiáng)化學(xué)習(xí)不僅能應(yīng)用在現(xiàn)實(shí)世界中,且在精準(zhǔn)靈巧的操作任務(wù)上效果極佳,且遠(yuǎn)超模仿學(xué)習(xí)方法,節(jié)拍數(shù)也平均快了 1.8 倍。
換言之,SERL 是真機(jī) RL 機(jī)器人領(lǐng)域的一個(gè)劃時(shí)代工作。而這個(gè)
原文鏈接:伯克利羅劍嵐:機(jī)器人的范式,藏在真實(shí)世界中丨具身先鋒十人談
聯(lián)系作者
文章來源:AI科技評(píng)論
作者微信:
作者簡介: