國產(chǎn)端側(cè)小模型超越 GPT-4V,「多模態(tài)」能力飛升

AIGC動態(tài)歡迎閱讀
原標(biāo)題:國產(chǎn)端側(cè)小模型超越 GPT-4V,「多模態(tài)」能力飛升
關(guān)鍵字:模型,能力,報告,終端,智能
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):8731字
內(nèi)容摘要:
端側(cè)大模型的解耦難題:是模型適配終端,還是終端適配模型?作者 | 西西
編輯 | 陳彩嫻
在剛剛過去的機器人學(xué)術(shù)頂會 ICRA 2024 上,「具身智能」成為熱議,其中圍繞具身智能的一個普遍疑問是:若將 AI 大模型應(yīng)用到消費級機器人領(lǐng)域,首先是模型適配終端,還是終端適配模型?
過去一年,由于 6B、7B 等小模型的成果井噴,以及 MoE 訓(xùn)練技術(shù)的越發(fā)成熟,將模型跑在手機、學(xué)習(xí)機、平板電腦、機器人甚至汽車等等終端應(yīng)用上的想象力開始變大,無論算法層還是硬件層都「蠢蠢欲動」。誠然,這已經(jīng)成為一個明朗的行業(yè)方向,但在系統(tǒng)整合上卻要面臨不同話語體系之間的博弈。
以機器人為例。從算法層看,將模型做小是關(guān)鍵,但硬件廠商關(guān)心的卻是模型能否適配自身的產(chǎn)品:
首先,消費機器人有固定的產(chǎn)品周期,從研發(fā)到投入市場往往要經(jīng)歷大半年到一年半左右的時間。因此,盡管 ChatGPT 破圈后已經(jīng)過去一年多,但目前已經(jīng)上市的掃地機中卻沒有已經(jīng)部署大模型的產(chǎn)品;
其次,硬件底層的芯片有上限,芯片設(shè)計完后就是一個性能參數(shù)限定的「物理」產(chǎn)品,其中帶寬能跑多少、內(nèi)存能用多大都已經(jīng)是已知數(shù),這就直接了應(yīng)用在硬件上的 AI 模型
原文鏈接:國產(chǎn)端側(cè)小模型超越 GPT-4V,「多模態(tài)」能力飛升
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。

粵公網(wǎng)安備 44011502001135號