Psi R0 – 靈初智能推出的端到端具身模型
Psi R0是什么
Psi R0是靈初智能推出的首個基于強化學習的端到端具身模型,具備雙靈巧手協同操作的能力,能夠應對復雜的任務。該模型支持將多項技能串聯混合訓練,創造出具備推理能力的智能體,從而實現閉環的長程靈巧操作。Psi R0展現出卓越的跨物品和跨場景泛化能力,具有較強的適應性和高水平的魯棒性。

Psi R0的主要功能
- 雙靈巧手協同操作:Psi R0能夠支持雙靈巧手的協同工作,順利執行多步驟的長程靈巧任務。
- 多技能串聯混訓:該模型可以將多項技能進行串聯混合訓練,從而生成具備推理能力的智能體,以完成閉環的復雜操作任務。
- 跨物品、跨場景泛化:Psi R0能夠實現跨物品和跨場景的泛化,展現出強大的適應性與高水平的魯棒性。
- 基于仿真數據訓練:通過利用大量仿真數據,Psi R0訓練出能夠進行雙手操作的智能體,并通過雙向訓練框架串聯多項技能,成功完成開放環境中的長程任務,處于行業領先地位。
- 解決獎勵函數設計難題:該技能訓練框架從物體的時空軌跡中提取關鍵信息,以構建通用目標函數,從而有效解決獎勵函數設計的難題。
- 后訓練階段優化:在后續的訓練階段,通過少量高質量的真實數據對齊,進一步提高長程任務的成功率。
- 自主切換技能能力:雙向訓練框架中的轉移可行性函數能夠微調技能,從而提升串聯的成功率與泛化能力,使模型在操作失敗時能夠迅速調整策略,確保高成功率。
Psi R0的技術原理
- 強化學習(RL):Psi R0是一個基于強化學習的端到端具身模型,通過大量仿真數據訓練出雙手操作的智能體。
- 技能訓練框架:這一框架從物體的時空軌跡中提取關鍵信息,構建通用目標函數,有效解決了獎勵函數設計的挑戰。
Psi R0的應用場景
- 電商場景:Psi R0可廣泛應用于電商行業的商品打包作業,完成涉及上萬件商品的抓取、掃碼、放置及打結等多重操作,能夠在客戶現場高效替代完整的工位。
- 工廠產線組裝:在制造業中,Psi R0可用于工廠生產線的組裝任務,執行復雜的長程作業,如部件的抓取、組裝和放置等。
- 服務業揀貨打包:Psi R0同樣適用于服務行業中的揀貨與打包作業,能夠高效處理長程任務,包括抓取、掃碼和放置等。
- 家居環境清潔整理:在家庭環境中,Psi R0能夠執行清潔與整理工作,處理各種日常家務任務。
產品官網
欲了解更多關于Psi R0的信息,可以訪問靈初智能的官方網站。
常見問題
如您對Psi R0有任何疑問,歡迎隨時咨詢我們的客服團隊,我們將竭誠為您服務。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號