清華大學高陽團隊榮獲CoRL 2024X-Embodiment Workshop最佳論文獎。
原標題:清華大學獲X-Embodiment最佳論文獎,機器人頂會CoRL 2024獲獎名單出爐
文章來源:AI科技評論
內容字數:6335字
清華大學高陽團隊榮獲CoRL 2024最佳論文獎
在最新一屆機器人頂級會議CoRL 2024(Conference on Robot Learning)中,來自清華大學的高陽團隊榮獲X-Embodiment Workshop最佳論文獎。他們的論文《Data Scaling Laws in Imitation Learning for Robotic Manipulation》探討了數據規模定律在機器人操作中的模仿學習應用,尤其是如何通過適當的數據規模實現零樣本泛化。
研究背景與方法
研究團隊收集了超過40,000次人類演示,并進行了15,000多次實際機器人操作。他們發現,策略的泛化能力主要依賴于環境和對象的多樣性,而不是單純的演示數量。在此基礎上,團隊設計了一種高效的數據收集方案,僅需四個采集者在一個下午就能獲取足夠的數據,使兩個任務在新環境和新對象上的成功率達到約90%。
實驗設計
研究團隊選擇使用手持夾持器(UMI)在不同環境中收集人類演示數據,并采用擴散策略(Diffusion Policy)對數據進行建模。實驗任務包括Pour Water(倒水)和Mouse Arrangement(鼠標移動),并擴展到Fold Towels(疊毛巾)和Unplug Charger(拔掉充電器)。實驗結果表明,策略的泛化能力與訓練環境和對象的數量密切相關,符合冪律分布。
研究結果
實驗顯示,隨著訓練物體和環境數量的增加,策略在未見物體和環境上的表現顯著提高。特別是當訓練物體數量達到32時,策略在未見物體上的表現超過0.9。這表明同時擴展環境和物體數量的效果更佳,并且額外的演示對性能的提升效果逐漸飽和。
團隊成員介紹
論文的主要作者包括高陽教授和他的學生林凡淇、胡英東、盛平岳、Chuan Wen及游嘉誠。林凡淇及胡英東分別為博士生,研究重點為具身智能,旨在實現機器人在人類水平操作能力上的突破。
最佳論文獎及其他獲獎論文
在CoRL 2024中,除了清華團隊的獲獎論文外,Kuo-Hao Zeng等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》和Franck Djeumou等人的《One Model to Drift Them All》也獲得最佳論文獎。這些研究展示了在機器人學習和自動駕駛領域的最新成果和技術進步。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。