AIGC動態歡迎閱讀
原標題:國產端側小模型超越 GPT-4V,「多模態」能力飛升
關鍵字:模型,能力,報告,終端,智能
文章來源:AI科技評論
內容字數:8731字
內容摘要:
端側大模型的解耦難題:是模型適配終端,還是終端適配模型?作者 | 西西
編輯 | 陳彩嫻
在剛剛過去的機器人學術頂會 ICRA 2024 上,「具身智能」成為熱議,其中圍繞具身智能的一個普遍疑問是:若將 AI 大模型應用到消費級機器人領域,首先是模型適配終端,還是終端適配模型?
過去一年,由于 6B、7B 等小模型的成果井噴,以及 MoE 訓練技術的越發成熟,將模型跑在手機、學習機、平板電腦、機器人甚至汽車等等終端應用上的想象力開始變大,無論算法層還是硬件層都「蠢蠢欲動」。誠然,這已經成為一個明朗的行業方向,但在系統整合上卻要面臨不同話語體系之間的博弈。
以機器人為例。從算法層看,將模型做小是關鍵,但硬件廠商關心的卻是模型能否適配自身的產品:
首先,消費機器人有固定的產品周期,從研發到投入市場往往要經歷大半年到一年半左右的時間。因此,盡管 ChatGPT 破圈后已經過去一年多,但目前已經上市的掃地機中卻沒有已經部署大模型的產品;
其次,硬件底層的芯片有上限,芯片設計完后就是一個性能參數限定的「物理」產品,其中帶寬能跑多少、內存能用多大都已經是已知數,這就直接了應用在硬件上的 AI 模型
原文鏈接:國產端側小模型超越 GPT-4V,「多模態」能力飛升
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...