實現了34440cm3最大操作空間范圍的高效覆蓋
原標題:機器人空間泛化也有Scaling Law!清華新國大新算法框架讓機器人操作更加魯棒
文章來源:量子位
內容字數:5919字
清華新加坡國立大學團隊提出ManiBox:機器人空間泛化新算法框架
清華大學和新加坡國立大學的研究團隊在機器人空間泛化領域取得重大突破,發現了空間智能的泛化性規律,并基于此規律提出了一種新穎的機器人操作算法框架——ManiBox。該框架能夠顯著提升機器人在真實世界中應對多樣化物置和復雜場景布置的能力。
1. 空間泛化難題與ManiBox的突破
傳統的機器人操作實驗通常在實驗室的“完美擺放位置”進行,難以適應真實世界中物體的多樣化位置和復雜場景。ManiBox則致力于解決這一空間泛化難題。通過在模擬器中生成大量數據,并結合低維視覺特征(如Bounding Box),ManiBox實現了在34440cm3最大操作空間范圍內的高效覆蓋,抓取成功率高達90%-100%。
2. ManiBox的泛化能力
ManiBox展現出強大的泛化能力,能夠應對各種物體(蘋果、鋼杯、玻璃燒杯等)、背景(不同顏色桌布、復雜桌面、動態光源等)和操作任務(抓取半空中物體、雜亂桌面上的物體、倒水等)。即使在視覺遮擋率高達40%或Bounding Box識別噪音高達5%的情況下,ManiBox依然保持高魯棒性和操作能力,甚至在黑暗環境下也能精準完成抓取任務。
3. ManiBox的核心思想
ManiBox的核心思想在于兩點:一是利用規模化、自動化的action數據生成方式訓練策略模塊,緩解action模態數據稀缺的問題;二是充分利用互聯網級別的數據量,在視覺、文本模態上構建通用模型,提供完成任務的重要指示信息。 這基于團隊在空間泛化性上取得的理論突破:發現任務成功率與數據量呈現米氏-曼特恩動力學曲線,以及空間泛化所需數據量與空間體積呈現冪律關系。
4. ManiBox的技術細節
ManiBox通過policy generalization方法解決空間泛化問題,并結合YOLO-World等模型提取低維空間信息,簡化狀態建模。通過訓練基于狀態的策略,實現了從仿真到真實世界的高效遷移。隨機掩碼技術和歷史軌跡信息進一步提升了策略的魯棒性。在訓練方面,采用高效數據生成與學生策略學習相結合的模式,實現了2小時強化學習策略訓練和2分鐘學生策略學習。
5. ManiBox的意義與應用前景
ManiBox不僅提供了一種高效可靠的機器人操作解決方案,更定義了一種“數據驅動的空間智能”方法,顯著提升了機器人操作任務的魯棒性和靈活性。其在工業和家庭應用中具有廣泛的潛力,為機器人在復雜真實場景中的應用奠定了理論和技術基礎。
6. 作者簡介
該工作的共同一作是清華大學計算機系博士生譚恒楷和新加坡國立大學本科生徐學舟,兩人均在具身智能和強化學習領域有深入研究,并發表過多篇論文。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破