AIGC動態歡迎閱讀
原標題:驍龍888實時運行,美團、浙大等打造全流程移動端多模態大模型MobileVLM
關鍵字:視覺,模型,本文,研究者,語言
文章來源:機器之心
內容字數:11177字
內容摘要:
機器之心報道
機器之心編輯部大模型涌向移動端的浪潮愈演愈烈,終于有人把多模態大模型也搬到了移動端上。近日,美團、浙大等推出了能夠在移動端部署的多模態大模型,包含了 LLM 基座訓練、SFT、VLM 全流程。也許不久的將來,每個人都能方便、快捷、低成本的擁有屬于自己的大模型。MobileVLM 是一款專為移動設備設計的快速、強大和開放的視覺語言助手。它結合了面向移動設備的架構設計和技術,包括從頭開始訓練的 1.4B 和 2.7B 參數的語言模型、以 CLIP 方式預訓練的多模態視覺模型,以及通過投影實現的高效跨模態交互。在各種視覺語言基準測試中,MobileVLM 的性能可媲美大型模型。此外,它還在高通驍龍 888 CPU 和英偉達 Jeston Orin GPU 上展示了最快的推理速度。論文地址:https://arxiv.org/pdf/2312.16886.pdf
Code 地址:https://github.com/Meituan-AutoML/MobileVLM
簡介
大型多模態模型(LMMs),尤其是視覺語言模型(VLMs)系列,由于其在感知和推理方面的能力大大增強,已成為構
原文鏈接:驍龍888實時運行,美團、浙大等打造全流程移動端多模態大模型MobileVLM
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...