原標題:Figure發布通用機器人控制模型Helix,人形機器人迎來新突破
文章來源:小夏聊AIGC
內容字數:3216字
Figure發布通用機器人控制模型Helix:開啟機器人新紀元
近日,機器人公司Figure在與OpenAI結束合作后,迅速推出了其首個重大成果——Helix,一個端到端的通用控制模型。這一突破性技術有望徹底改變我們對機器人的認知,并加速其在日常生活中的應用。
Helix:賦予機器人類人能力
Helix并非簡單的機器人控制程序,它是一個能夠賦予機器人類似人類感知、理解和行動能力的通用模型。通過簡單的自然語言指令,機器人就能完成復雜的任務,例如拿起各種形狀、大小、材質的物品,甚至包括之前從未見過的物體,比如文中提到的仙人掌。官方演示視頻中,機器人能夠準確地按照指令將桌上的物品依次放入冰箱,展現了其強大的執行能力和對環境的理解。
更令人驚嘆的是,兩個配備Helix的機器人可以協同工作,并且它們共享同一組神經網絡,這體現了該模型在多機器人協作方面的巨大潛力。
技術突破:高效、靈活、通用
Helix的成功并非偶然,它背后是一系列關鍵的技術突破:
完整的上半身控制:Helix能夠以200Hz的高頻率精確控制機器人的整個上半身,包括手腕、軀干、頭部和手指,實現了前所未有的精細操作。
多機器人協作:Helix是首個能夠同時控制兩個機器人的VLA模型,使它們能夠協同完成復雜任務,例如共同搬運大型物品。
強大的物體泛化能力:Helix能夠識別和操作數千種從未見過的家居物品,僅需簡單的自然語言指令即可完成任務,無需針對特定物體進行單獨訓練。
單一神經網絡:Helix使用單一神經網絡權重集來學習所有行為,無需針對特定任務進行微調,簡化了模型訓練和部署過程。
高效的商業化部署:Helix能夠在嵌入式低功耗GPU上運行,降低了部署成本,加速了商業化進程。
Helix的運作機制:雙系統協同
Helix由兩個系統組成:系統1負責底層控制,以200Hz的高速運行,將系統2生成的語義表示轉化為精確的機器人動作;系統2基于7B開源VLM,負責場景和語言理解,以7-9Hz的頻率運行,對不同的對象和語境進行泛化。這種解耦架構允許每個系統在其最佳時間尺度上運行,實現了高效的控制和理解。
Scaling Law:未來無限可能
Figure CEO指出,Helix代表了一種新型的Scaling Law,這意味著一旦模型規模擴大,其能力將得到指數級的提升。目前,訓練機器人完成一項新任務需要耗費大量的人力資源,而Helix能夠即時生成長時程、協作式、靈巧的操作,無需任何特定任務的演示或大量的手動編程。這意味著,Figure在擴展人形機器人行為方面邁出了性的一步。想象一下,如果Helix擴大1000倍,機器人數量擴展到數十億級別,將會為我們的生活帶來怎樣的改變?
結語:一個嶄新的機器人時代
Helix的出現標志著機器人技術進入了一個新的時代。它不僅解決了機器人控制的諸多難題,更重要的是,它展現了通用人工智能在機器人領域應用的巨大潛力。未來,我們可以期待更加智能、靈活、高效的機器人融入我們的生活,為我們帶來更多便利和驚喜。
聯系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內容的前沿信息與技術分享。我們提供AI生成藝術、文本、音樂、視頻等領域的最新動態與應用案例。每日新聞速遞、技術解讀、行業分析、專家觀點和創意展示。期待與您一起探索AI的無限潛力。歡迎關注并分享您的AI作品或寶貴意見。