一句指令就能沖咖啡、倒紅酒、錘釘子,清華具身智能CoPa「動」手了
AIGC動態(tài)歡迎閱讀
原標題:一句指令就能沖咖啡、倒紅酒、錘釘子,清華具身智能CoPa「動」手了
關(guān)鍵字:任務,物體,機器人,模型,部分
文章來源:機器之心
內(nèi)容字數(shù):5676字
內(nèi)容摘要:
機器之心專欄
機器之心編輯部近期,具身智能方向取得了諸多進展。從谷歌的 RT-H 到 OpenAI、Figure 聯(lián)合打造的 Figure 01,機器人的交互性、通用性越來越強。
如果未來機器人成為人們?nèi)粘I畹闹郑闫诖鼈兡軌蛲瓿赡男┤蝿眨颗菀槐瓱釟怛v騰的手沖咖啡,整理桌面,甚至幫你精心安排一場浪漫的約會,這些任務,只需一句指令,清華的具身智能新框架「CoPa」都能完成。
CoPa(Robotic Manipulation through Spatial Constraints of Parts)是清華叉院高陽教授機器人研究團隊最新提出的具身智能框架,首次實現(xiàn)了多場景、長程任務、復雜3D行為的泛化能力。論文地址:https://arxiv.org/abs/2403.08248
項目主頁:https://copa-2024.github.io/
得益于對視覺語言大模型(VLMs)的創(chuàng)新使用,在不經(jīng)過任何訓練的前提下,CoPa 可以泛化到開放場景中,處理復雜的指令。CoPa 最令人驚喜的是它展現(xiàn)出對場景中物體的物理屬性具備細致的理解,以及其精確的規(guī)劃與操作能力。
例如,CoPa 能夠
原文鏈接:一句指令就能沖咖啡、倒紅酒、錘釘子,清華具身智能CoPa「動」手了
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務平臺
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...