哈工深聶禮強(qiáng):多模態(tài)大模型是具身智能發(fā)展的關(guān)鍵動力丨具身智能十人談
AIGC動態(tài)歡迎閱讀
原標(biāo)題:哈工深聶禮強(qiáng):多模態(tài)大模型是具身智能發(fā)展的關(guān)鍵動力丨具身智能十人談
關(guān)鍵字:模型,智能,機(jī)器人,大腦,領(lǐng)域
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
沒有多模態(tài)大模型的“大腦”,“身體”只是一個無智能的機(jī)械裝置。作者丨陳鷺伊
編輯丨岑峰
具身智能的“智能”如何體現(xiàn)?
這是雷峰網(wǎng)-AI科技評論啟動“具身智能十人談”欄目以來,在拜訪這一領(lǐng)域的諸多研究者時最常提到的話題之一。
具身智能,簡而言之,是指將智能系統(tǒng)與物理實體相結(jié)合,使其能夠感知環(huán)境、進(jìn)行決策并執(zhí)行動作的一門技術(shù)。其關(guān)鍵詞是“具身”,即不僅僅是抽象的算法和數(shù)據(jù),而是要通過物理形態(tài)與世界進(jìn)行交互。
然而,要實現(xiàn)真正的“智能”,具身智能系統(tǒng)需要一個強(qiáng)大的“大腦”來支撐其復(fù)雜的決策和學(xué)習(xí)過程。這里的“大腦”并非生物學(xué)意義上的器官,而是指一種能夠處理和理解多模態(tài)信息的高級計算模型——多模態(tài)大模型。這種模型能夠整合視覺、聽覺、觸覺等多種感官數(shù)據(jù),以及語言、指令等抽象信息,為機(jī)器人提供更為豐富和全面的環(huán)境理解能力。
2022年11月,ChatGPT的問世展現(xiàn)了大型語言模型(LLM)的突破,不僅激發(fā)了對大模型在各行各業(yè)應(yīng)用的無限想象,也將“具身智能”推到了聚光燈下,引發(fā)了對機(jī)器如何更自然地與人類及環(huán)境互動的深入探討,激發(fā)了新一模態(tài)大模型研究的浪潮。
自然語言處理(NLP)是大模型底層核心
原文鏈接:哈工深聶禮強(qiáng):多模態(tài)大模型是具身智能發(fā)展的關(guān)鍵動力丨具身智能十人談
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。