AIGC動態歡迎閱讀
原標題:CVPR 2024滿分論文|英偉達開源大模型FoundationPose稱霸BOP排行榜
關鍵字:模型,姿態,物體,數據,研究人員
文章來源:新智元
內容字數:11820字
內容摘要:
新智元報道編輯:LRS
【新智元導讀】FoundationPose模型使用RGBD圖像對新穎物體進行姿態估計和跟蹤,支持基于模型和無模型設置,在多個公共數據集上大幅優于針對每個任務專門化的現有方法.FoundationPose是一個「用于6D物體姿態估計和跟蹤」的統一大模型,支持基于模型和無模型設置,無需微調即可應用于新穎的物體上,只要給出其CAD模型,或者拍攝少量參考圖像即可。論文地址:https://arxiv.org/abs/2312.08344
項目主頁:https://nvlabs.github.io/FoundationPose/
項目代碼:https://github.com/NVlabs/FoundationPose
研究人員通過神經隱式表示來彌合這兩種設置之間的差距,這種表示允許有效的新視圖合成,并在同一統一框架下保持下游姿態估計模塊的不變性。
在大規模合成訓練、大型語言模型(LLM)、一種新穎的基于Transformer的架構和對比學習公式的輔助下,模型實現了強大的泛化能力。在涉及挑戰性場景和物體的多個公共數據集上進行了廣泛評估,結果表明該方法在性能上大幅優于
原文鏈接:CVPR 2024滿分論文|英偉達開源大模型FoundationPose稱霸BOP排行榜
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...