百萬真機數據集的終極目標是打造硬件加系統的 AI 次方模式,構建真正智能的端到端具身系統。
原標題:香港大學李弘揚:「2025年具身智能新一代閉環智能系統」迫在眉睫丨具身先鋒十人談
文章來源:AI科技評論
內容字數:15752字
AgiBot World:百萬真機數據集推動具身智能發展
本文總結了李弘揚博士團隊關于AgiBot World百萬真機數據集及其對具身智能領域影響的訪談內容。該數據集旨在打造硬件加系統的AI次方模式,構建真正智能的端到端具身系統,并推動該領域的“ImageNet時刻”。
1. 從自動駕駛到具身智能:經驗的遷移與挑戰
李弘揚博士團隊最初專注于端到端自動駕駛算法研究,其UniAD項目獲得CVPR 2023最佳論文。 他們發現自動駕駛和機器人領域存在許多共通之處,例如感知、預測和控制的構成以及與環境交互的方式。 然而,將端到端訓練范式遷移到機器人領域也面臨挑戰,例如機器人任務的度更高,數據采集難度更大。團隊提出了“數據金字塔策略”,結合仿真數據、網絡數據和真機數據來解決數據問題。
2. AgiBot World:打造具身智能的ImageNet時刻
AgiBot World數據集是團隊與智元機器人合作的成果,其最大亮點在于靈巧手操作、視觸覺多模態信號和多機協同。與其他數據集相比,AgiBot World的數據更具質量和統一性,物理形態趨于統一,這對于算法的泛化能力至關重要。該數據集旨在解決具身智能的兩個核心問題:實現真正智能化和驗證Scaling Law。團隊計劃在2025年3月發布完整數據集,并在CVPR、IROS等場合舉辦挑戰賽,促進學術界和產業界的共同發展。
3. 數據采集與開源的意義
AgiBot World的數據采集過程借鑒了亞馬遜SageMaker和《Human-in-the-Loop Machine Learning》中的經驗,注重數據質量的把控。 團隊有意制造干擾來考察算法的魯棒性。開源AgiBot World的初衷是建立類似ImageNet的評測基準,促進公平的算法比較,并降低高質量真機數據采集的門檻,推動整個領域的進步。
4. 未來研究方向與挑戰
團隊的下一步研究計劃包括擴展AgiBot World數據集到百萬級別,驗證Scaling Law,并舉辦挑戰賽。 他們認為,具身智能領域模型訓練會遵循Scaling Law,但需要解決數據多樣性、數據分布、算法遷移學習和投入產出比等問題。除了數據集,團隊還在研究Whole Body Control等問題,并強調了硬件創新在推動具身智能發展中的重要性,特別指出材料科學在傳感器和硬件方面的突破性意義。
5. 總結
AgiBot World百萬真機數據集的發布,標志著具身智能領域發展進入一個新的階段。 該數據集的開源以及團隊后續的研究工作,將有力推動該領域的技術進步和產業發展,有望實現具身智能領域的“ImageNet時刻”。
聯系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。