一句指令就能沖咖啡、倒紅酒、錘釘子，清華具身智能CoPa「動」手了

AIGC動態2年前 (2024)發布機器之心

AIGC動態歡迎閱讀

原標題：一句指令就能沖咖啡、倒紅酒、錘釘子，清華具身智能CoPa「動」手了
關鍵字：任務,物體,機器人,模型,部分
文章來源：機器之心
內容字數：5676字

內容摘要：

機器之心專欄
機器之心編輯部近期，具身智能方向取得了諸多進展。從谷歌的 RT-H 到 OpenAI、Figure 聯合打造的 Figure 01，機器人的交互性、通用性越來越強。
如果未來機器人成為人們日常生活的助手，你期待它們能夠完成哪些任務？泡一杯熱氣騰騰的手沖咖啡，整理桌面，甚至幫你精心安排一場浪漫的約會，這些任務，只需一句指令，清華的具身智能新框架「CoPa」都能完成。
CoPa（Robotic Manipulation through Spatial Constraints of Parts）是清華叉院高陽教授機器人研究團隊最新提出的具身智能框架，首次實現了多場景、長程任務、復雜3D行為的泛化能力。論文地址：https://arxiv.org/abs/2403.08248
項目主頁：https://copa-2024.github.io/
得益于對視覺語言大模型（VLMs）的創新使用，在不經過任何訓練的前提下，CoPa 可以泛化到開放場景中，處理復雜的指令。CoPa 最令人驚喜的是它展現出對場景中物體的物理屬性具備細致的理解，以及其精確的規劃與操作能力。
例如，CoPa 能夠

原文鏈接：一句指令就能沖咖啡、倒紅酒、錘釘子，清華具身智能CoPa「動」手了