國產端側小模型超越 GPT-4V，「多模態」能力飛升

AIGC動態歡迎閱讀

原標題：國產端側小模型超越 GPT-4V，「多模態」能力飛升
關鍵字：模型,能力,報告,終端,智能
文章來源：AI科技評論
內容字數：8731字

內容摘要：

端側大模型的解耦難題：是模型適配終端，還是終端適配模型？作者 | 西西
編輯 | 陳彩嫻
在剛剛過去的機器人學術頂會 ICRA 2024 上，「具身智能」成為熱議，其中圍繞具身智能的一個普遍疑問是：若將 AI 大模型應用到消費級機器人領域，首先是模型適配終端，還是終端適配模型？
過去一年，由于 6B、7B 等小模型的成果井噴，以及 MoE 訓練技術的越發成熟，將模型跑在手機、學習機、平板電腦、機器人甚至汽車等等終端應用上的想象力開始變大，無論算法層還是硬件層都「蠢蠢欲動」。誠然，這已經成為一個明朗的行業方向，但在系統整合上卻要面臨不同話語體系之間的博弈。
以機器人為例。從算法層看，將模型做小是關鍵，但硬件廠商關心的卻是模型能否適配自身的產品：
首先，消費機器人有固定的產品周期，從研發到投入市場往往要經歷大半年到一年半左右的時間。因此，盡管 ChatGPT 破圈后已經過去一年多，但目前已經上市的掃地機中卻沒有已經部署大模型的產品；
其次，硬件底層的芯片有上限，芯片設計完后就是一個性能參數限定的「物理」產品，其中帶寬能跑多少、內存能用多大都已經是已知數，這就直接了應用在硬件上的 AI 模型

原文鏈接：國產端側小模型超越 GPT-4V，「多模態」能力飛升