機器人空間泛化也有Scaling Law！清華新國大新算法框架讓機器人操作更加魯棒

實現了34440cm3最大操作空間范圍的高效覆蓋

原標題：機器人空間泛化也有Scaling Law！清華新國大新算法框架讓機器人操作更加魯棒
文章來源：量子位
內容字數：5919字

清華新加坡國立大學團隊提出ManiBox：機器人空間泛化新算法框架

清華大學和新加坡國立大學的研究團隊在機器人空間泛化領域取得重大突破，發現了空間智能的泛化性規律，并基于此規律提出了一種新穎的機器人操作算法框架——ManiBox。該框架能夠顯著提升機器人在真實世界中應對多樣化物置和復雜場景布置的能力。

1. 空間泛化難題與ManiBox的突破

傳統的機器人操作實驗通常在實驗室的“完美擺放位置”進行，難以適應真實世界中物體的多樣化位置和復雜場景。ManiBox則致力于解決這一空間泛化難題。通過在模擬器中生成大量數據，并結合低維視覺特征（如Bounding Box），ManiBox實現了在34440cm3最大操作空間范圍內的高效覆蓋，抓取成功率高達90%-100%。

2. ManiBox的泛化能力

ManiBox展現出強大的泛化能力，能夠應對各種物體（蘋果、鋼杯、玻璃燒杯等）、背景（不同顏色桌布、復雜桌面、動態光源等）和操作任務（抓取半空中物體、雜亂桌面上的物體、倒水等）。即使在視覺遮擋率高達40%或Bounding Box識別噪音高達5%的情況下，ManiBox依然保持高魯棒性和操作能力，甚至在黑暗環境下也能精準完成抓取任務。

3. ManiBox的核心思想

ManiBox的核心思想在于兩點：一是利用規模化、自動化的action數據生成方式訓練策略模塊，緩解action模態數據稀缺的問題；二是充分利用互聯網級別的數據量，在視覺、文本模態上構建通用模型，提供完成任務的重要指示信息。這基于團隊在空間泛化性上取得的理論突破：發現任務成功率與數據量呈現米氏-曼特恩動力學曲線，以及空間泛化所需數據量與空間體積呈現冪律關系。

4. ManiBox的技術細節

ManiBox通過policy generalization方法解決空間泛化問題，并結合YOLO-World等模型提取低維空間信息，簡化狀態建模。通過訓練基于狀態的策略，實現了從仿真到真實世界的高效遷移。隨機掩碼技術和歷史軌跡信息進一步提升了策略的魯棒性。在訓練方面，采用高效數據生成與學生策略學習相結合的模式，實現了2小時強化學習策略訓練和2分鐘學生策略學習。

5. ManiBox的意義與應用前景

ManiBox不僅提供了一種高效可靠的機器人操作解決方案，更定義了一種“數據驅動的空間智能”方法，顯著提升了機器人操作任務的魯棒性和靈活性。其在工業和家庭應用中具有廣泛的潛力，為機器人在復雜真實場景中的應用奠定了理論和技術基礎。

6. 作者簡介

該工作的共同一作是清華大學計算機系博士生譚恒楷和新加坡國立大學本科生徐學舟，兩人均在具身智能和強化學習領域有深入研究，并發表過多篇論文。

聯系作者

文章來源：量子位
作者微信：
作者簡介：追蹤人工智能新趨勢，關注科技行業新突破

閱讀原文

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

機器人空間泛化也有Scaling Law！清華新國大新算法框架讓機器人操作更加魯棒

實現了34440cm3最大操作空間范圍的高效覆蓋

清華新加坡國立大學團隊提出ManiBox：機器人空間泛化新算法框架

1. 空間泛化難題與ManiBox的突破

2. ManiBox的泛化能力

3. ManiBox的核心思想

4. ManiBox的技術細節

5. ManiBox的意義與應用前景

6. 作者簡介

聯系作者

ECCV 2024 Oral！上交大聯合網易伏羲開源用于對話人臉生成的高效解耦框架EDTalk | 一作譚帥博士主講預告

國產 AI 視頻第一梯隊比拼！讓 Sora 翻車的動作，可靈們能做好嗎

相關文章

暫無評論

ChatGPT

畢業論文生成器

AIGC熱點