ToddlerBot

ToddlerBot – 斯坦福大學開源的機器學習與人形機器人平臺

ToddlerBot是什么

ToddlerBot是斯坦福大學開發的一個開源操作平臺，旨在通過高效地收集大規模和高質量的訓練數據，推動機器學習與人形機器人的研究。ToddlerBot配備了30個主動度，采用Dynamixel電機，其整體成本控制在6000美元以內。利用數字孿生技術和零點校準，ToddlerBot能夠實現從模擬環境到現實世界的無樣本遷移，且配備的遠程操作設備能夠高效地支持現實世界數據的采集。ToddlerBot在執行和操作任務時表現優異，如臂展、負載能力、耐力以及動態能力。其開放的設計和詳細的組裝手冊使其易于復制和維護，非常適合多種研究應用。

ToddlerBot

ToddlerBot的主要功能

高效數據收集：能夠在模擬環境和現實世界中同時收集高質量訓練數據，支持大規模機器學習任務。
全身與操作：具備30個主動度，能夠執行復雜的全身和操作任務，如步行、俯臥撐、引體向上、雙臂操作以及全身協調操作。
零樣本模擬到現實轉移：依托高保真的數字孿生技術和電機系統識別，確保模擬與現實之間的無縫策略轉移。
遠程操作與數據收集：配備直觀的遠程控制設備，支持基于人類示范快速收集現實世界數據，助力技能的學習。
人機交互與協作：支持多個機器人協作完成任務，如共同進行房間清理等復雜場景。

ToddlerBot的技術原理

數字孿生與零點校準：
- 數字孿生：基于精確的物理模型和系統識別技術，構建高保真的模擬模型，確保模擬數據與真實世界的一致性。
- 零點校準：使用3D打印的校準裝置，快速校準機器人的零點位置，以確保控制的精確性。
電機系統識別（SysID）：通過命令電機跟蹤掃頻信號，收集位置跟蹤數據，擬合執行模型，確保動態參數的準確性，使得機器人在模擬與現實中具備相同的特性。
遠程操作技術：利用第二個上肢作為遠程控制設備，通過力敏電阻和手持游戲機（如Steam Deck或ROG Ally X）來操控機器人的，支持人類操作員直觀指導機器人完成復雜任務。
強化學習與模仿學習：
- 強化學習（RL）：利用MuJoCo和PPO算法訓練步行和轉向策略，輸出關節位置設定值，實現高效的控制。
- 模仿學習：通過遠程操作收集現實世界數據，訓練擴散策略（Diffusion Policy），以完成復雜的操作任務。