李飛飛「空間智能」之后,上交、智源、北大等提出空間大模型SpatialBot
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:李飛飛「空間智能」之后,上交、智源、北大等提出空間大模型SpatialBot
關(guān)鍵字:深度,模型,物體,場(chǎng)景,任務(wù)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文第一作者為斯坦福大學(xué)研究生蔡聞驍,此前,他以績(jī)點(diǎn)第一名的成績(jī)?cè)跂|南大學(xué)取得學(xué)士學(xué)位。他的研究興趣為多模態(tài)大模型、具身智能。此工作為其在上海交通大學(xué)訪問和北京智源人工智能研究院實(shí)習(xí)期間完成,導(dǎo)師為本文通訊作者趙波教授。
此前,李飛飛老師提出了空間智能 (Spatial Intelligence) 這一概念,作為回應(yīng),來自上交、斯坦福、智源、北大、牛津、東大的研究者提出了空間大模型 SpatialBot,并提出了訓(xùn)練數(shù)據(jù) SpatialQA 和測(cè)試榜單 SpatialBench, 嘗試讓多模態(tài)大模型在通用場(chǎng)景和具身場(chǎng)景下理解深度、理解空間。論文標(biāo)題: SpatialBot: Precise Depth Understanding with Vision Lan
原文鏈接:李飛飛「空間智能」之后,上交、智源、北大等提出空間大模型SpatialBot
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: