CVPR 2024滿分論文｜英偉達開源大模型FoundationPose稱霸BOP排行榜

AIGC動態2年前 (2024)發布新智元

AIGC動態歡迎閱讀

原標題：CVPR 2024滿分論文｜英偉達開源大模型FoundationPose稱霸BOP排行榜
關鍵字：模型,姿態,物體,數據,研究人員
文章來源：新智元
內容字數：11820字

內容摘要：

新智元報道編輯：LRS
【新智元導讀】FoundationPose模型使用RGBD圖像對新穎物體進行姿態估計和跟蹤，支持基于模型和無模型設置，在多個公共數據集上大幅優于針對每個任務專門化的現有方法.FoundationPose是一個「用于6D物體姿態估計和跟蹤」的統一大模型，支持基于模型和無模型設置，無需微調即可應用于新穎的物體上，只要給出其CAD模型，或者拍攝少量參考圖像即可。論文地址：https://arxiv.org/abs/2312.08344
項目主頁：https://nvlabs.github.io/FoundationPose/
項目代碼：https://github.com/NVlabs/FoundationPose
研究人員通過神經隱式表示來彌合這兩種設置之間的差距，這種表示允許有效的新視圖合成，并在同一統一框架下保持下游姿態估計模塊的不變性。
在大規模合成訓練、大型語言模型（LLM）、一種新穎的基于Transformer的架構和對比學習公式的輔助下，模型實現了強大的泛化能力。在涉及挑戰性場景和物體的多個公共數據集上進行了廣泛評估，結果表明該方法在性能上大幅優于

原文鏈接：CVPR 2024滿分論文｜英偉達開源大模型FoundationPose稱霸BOP排行榜