機(jī)器人端側(cè)模型的十字路口
大模型、機(jī)器人與芯片廠商的拉力賽。
原標(biāo)題:機(jī)器人端側(cè)模型的十字路口
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):14620字
大模型、機(jī)器人與芯片廠商的“不可能三角”:誰將破局?
近年來,大模型和具身智能機(jī)器人成為科技發(fā)展兩大驅(qū)動力,兩者結(jié)合提升機(jī)器人智能水平成為重要趨勢。然而,大模型在機(jī)器人終端的落地卻面臨“不可能三角”的困境:模型廠商依賴芯片廠商,芯片廠商依賴機(jī)器人廠商,機(jī)器人廠商又依賴模型廠商,形成負(fù)反饋循環(huán)。
1. 大模型賦能機(jī)器人:挑戰(zhàn)與機(jī)遇
大模型為機(jī)器人提供“大腦”,提升其泛化和規(guī)劃能力,但目前主要用于簡單任務(wù)理解和拆分。大模型的泛化、規(guī)劃、糾錯等能力在機(jī)器人領(lǐng)域的應(yīng)用仍處于初步階段,主要原因在于:
缺乏適合機(jī)器人的模型框架:目前缺乏像LLM一樣統(tǒng)一的架構(gòu),不同形態(tài)的機(jī)器人對大模型有不同要求。
數(shù)據(jù)不足:模型廠商難以獲取大量、多元化的預(yù)訓(xùn)練數(shù)據(jù),導(dǎo)致模型泛化能力不足,尤其在精細(xì)動作控制方面。
知識壁壘:大模型廠商和機(jī)器人廠商之間存在知識壁壘,難以有效融合。
2. “機(jī)器人大腦”的三角拉力賽
機(jī)器人廠商的量產(chǎn)不足是核心問題。目前機(jī)器人主要面向?qū)I(yè)用戶,應(yīng)用場景有限,導(dǎo)致數(shù)據(jù)積累不足,難以訓(xùn)練出高性能的模型。這又反過來影響芯片廠商的研發(fā)投入,因?yàn)槿狈κ袌鲂枨螅m配機(jī)器人端側(cè)模型的芯片迭代緩慢。
數(shù)據(jù)標(biāo)注困難:機(jī)器人數(shù)據(jù)采集和標(biāo)注成本高昂,需要真機(jī)采集多元化數(shù)據(jù)。
算力瓶頸:云端大模型難以在機(jī)器人端部署,而端側(cè)小模型能力有限,需要在能力和算力之間尋求平衡。
芯片適配難題:模型需要與不同芯片適配,且低功耗芯片的算力限制嚴(yán)重影響模型性能。
3. 如何打破“死循環(huán)”?
打破“不可能三角”需要三方合力:模型廠商、芯片廠商和機(jī)器人廠商需要共同努力。
端云協(xié)作:在云端訓(xùn)練大模型,再通過知識蒸餾等方式得到小模型部署在終端。
非Transformer架構(gòu):探索非Transformer架構(gòu),降低算力要求和功耗。
芯片適配優(yōu)化:模型廠商和芯片廠商合作優(yōu)化推理框架,充分利用芯片算力。
機(jī)器人廠商提升量產(chǎn):增加機(jī)器人出貨量,擴(kuò)大應(yīng)用場景,吸引更多資源投入。
最終,機(jī)器人大模型的發(fā)展需要模型、芯片和機(jī)器人廠商的共同努力,只有打破現(xiàn)有瓶頸,才能形成正向循環(huán),實(shí)現(xiàn)機(jī)器人智能水平的快速提升。
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。