強化學習訓練一兩個小時，100%自主完成任務：機器人ChatGPT時刻真來了？

AIGC動態1年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：強化學習訓練一兩個小時，100%自主完成任務：機器人 ChatGPT時刻真來了？
關鍵字：機器人,策略,任務,人類,緩存
文章來源：機器之心
內容字數：0字

內容摘要：

機器之心報道
編輯：Panda、佳琪把平均成功率從 50% 拉到了 100%。最近，AI 的進步有目共睹，現在這些進步已經開始傳遞到機器人領域。強大的 AI 技術也能幫助機器人更好地理解其所處的物理世界并采取更合理的行動。
近日，UC 伯克利 BAIR 實驗室的 Sergey Levine 研究團隊提出了一個強化學習框架 HIL-SERL，可直接在現實世界中訓練通用的基于視覺的機器人操作策略。HIL-SERL 的表現堪稱前所未有的卓越，僅需 1-2.5 小時的訓練就能在所有任務上實現 100% 的成功率。要知道，基線方法的平均成功率還不到50%。就算有外部干擾，機器人也能取得很好的表現。論文一作 Jianlan Luo 的推文，他目前正在 UC 伯克利 BAIR 實驗室從事博士后研究團隊導師 Sergey Levine 也發了推文宣傳這項研究，他是一位非常著名的 AI 和機器人研究科學家，曾是 2021 年發表相關論文最多的研究者，參閱機器之心報道《2021 年 ML 和 NLP 學術統計：谷歌斷層第一，強化學牛 Sergey Levine 位居榜首》
空口無憑，眼見為實，那就先讓

原文鏈接：強化學習訓練一兩個小時，100%自主完成任務：機器人ChatGPT時刻真來了？