原標題:宇樹G1人形機器人習得少林功夫?揭秘BeamDojo強化學習框架
文章來源:小夏聊AIGC
內容字數:2157字
人形機器人G1:少林功夫的現代詮釋
近日,一款名為宇樹G1的人形機器人憑借其令人驚嘆的平衡能力引發廣泛關注。它在梅花樁和平衡木上行走自如,動作流暢穩定,仿佛一位習得少林功夫的武林高手,在網絡上掀起熱議。
突破技術瓶頸:BeamDojo強化學習框架
G1的出色表現并非偶然,其背后是上海AI實驗室、上海交通大學、浙江大學、香港大學和香港中文大合研發的BeamDojo強化學習框架的功勞。該框架是首個基于學習的方法,能夠讓人形機器人在落腳點稀疏的復雜地形上實現精細的落腳點控制,攻克了長期困擾人形機器人控制的技術難題。
傳統方法難以直接應用于人形機器人,主要是因為四足機器人成功的經驗難以直接移植到人形機器人上。四足機器人通常采用點狀腳,而人形機器人的腳部是多邊形,這使得為點狀腳設計的落腳點獎勵機制不再適用。此外,基于學習的人形機器人研究在復雜地形和精細落腳點上的靈活方面也存在問題,獎勵信號稀疏導致學習效率低下。
G1的精彩演示:挑戰極限,從容應對
在演示視頻中,G1輕松穿越了多個寬度僅約20厘米、間距不一的踏腳石,甚至能夠倒著走。面對寬度同樣為20厘米的平衡木挑戰,它也表現得游刃有余。更令人印象深刻的是,即使背負6千克重物或受到外部干擾,G1仍然能夠保持平衡,穩定地完成任務。
網友紛紛評論,G1的表演宛如中國功夫片的場景再現,展現了科技與傳統文化的奇妙融合。
BeamDojo框架的技術創新:高效學習,零樣本泛化
BeamDojo框架的成功,離不開以下幾個關鍵的技術創新:
- 兩階段強化學習訓練策略:先在平地進行預學習,再切換到實際任務地形進行策略優化,顯著提高了學習效率。
- 基于采樣的落腳點獎勵機制和“雙評價器”架構:專門為多邊形腳掌設計,有效平衡了密集移動獎勵和稀疏落腳點獎勵之間的學習過程。
- 基于激光雷達的高程地圖系統:使機器人能夠實時感知地形細節,為精準落腳提供數據支持。
- 零樣本泛化能力:G1在訓練過程中從未接觸過稀疏地形與平衡木,卻能夠對各類稀疏落腳點地形做到零樣本泛化。
實驗結果表明,BeamDojo在模擬環境和現實世界中都實現了高效學習,讓人形機器人在稀疏落腳點上精準落腳并靈活移動,即使受到較大的外部干擾,也能保持較高的成功率。這項技術未來還可應用于溝壑等更具挑戰性的復雜地形。
結語:未來展望
G1的成功展示了人形機器人技術取得的重大突破,也預示著未來人形機器人將在更多領域發揮作用。BeamDojo框架的研發,為人形機器人在復雜環境下的控制提供了新的思路和方法,為人工智能和機器人技術的進一步發展奠定了堅實的基礎。
聯系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內容的前沿信息與技術分享。我們提供AI生成藝術、文本、音樂、視頻等領域的最新動態與應用案例。每日新聞速遞、技術解讀、行業分析、專家觀點和創意展示。期待與您一起探索AI的無限潛力。歡迎關注并分享您的AI作品或寶貴意見。
相關文章
