強化學習訓練一兩個小時,100%自主完成任務(wù):機器人ChatGPT時刻真來了?
AIGC動態(tài)歡迎閱讀
原標題:強化學習訓練一兩個小時,100%自主完成任務(wù):機器人ChatGPT時刻真來了?
關(guān)鍵字:機器人,策略,任務(wù),人類,緩存
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
機器之心報道
編輯:Panda、佳琪把平均成功率從 50% 拉到了 100%。最近,AI 的進步有目共睹,現(xiàn)在這些進步已經(jīng)開始傳遞到機器人領(lǐng)域。強大的 AI 技術(shù)也能幫助機器人更好地理解其所處的物理世界并采取更合理的行動。
近日,UC 伯克利 BAIR 實驗室的 Sergey Levine 研究團隊提出了一個強化學習框架 HIL-SERL,可直接在現(xiàn)實世界中訓練通用的基于視覺的機器人操作策略。HIL-SERL 的表現(xiàn)堪稱前所未有的卓越,僅需 1-2.5 小時的訓練就能在所有任務(wù)上實現(xiàn) 100% 的成功率。要知道,基線方法的平均成功率還不到50%。就算有外部干擾,機器人也能取得很好的表現(xiàn)。論文一作 Jianlan Luo 的推文,他目前正在 UC 伯克利 BAIR 實驗室從事博士后研究團隊導師 Sergey Levine 也發(fā)了推文宣傳這項研究,他是一位非常著名的 AI 和機器人研究科學家,曾是 2021 年發(fā)表相關(guān)論文最多的研究者,參閱機器之心報道《2021 年 ML 和 NLP 學術(shù)統(tǒng)計:谷歌斷層第一,強化學牛 Sergey Levine 位居榜首》
空口無憑,眼見為實,那就先讓
原文鏈接:強化學習訓練一兩個小時,100%自主完成任務(wù):機器人ChatGPT時刻真來了?
聯(lián)系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...