AIGC動態歡迎閱讀
原標題:1元=1700000tokens!清華系發布國產Mistral僅2B,老手機都帶得動,GitHub一天斬獲300+星
關鍵字:小鋼炮,模型,華為,小米,報告
文章來源:量子位
內容字數:9484字
內容摘要:
金磊 發自 凹非寺量子位 | 公眾號 QbitAI一個體量僅為2B的大模型,能有什么用?
答案可能超出你的想象。
因為若是用四個字來概括,那就是“多、快、好、省”:
多:它是業界第一個在端側部署多模態的大模型。
快:一張1080Ti可高效微調、一臺機器可以持續訓練。
好:性能跟體量極具反差感,在多項成績中超越了一眾主流“大體量”大模型。
省:1元=1700000 tokens,成本為Mistral-Medium百分之一
那么,這個能夠“以小博大”,頗有四兩撥千斤意味的大模型,到底什么來頭?
不賣關子,它正是由清華系初創公司面壁智能最新發布的旗艦終端大模型——MiniCPM。
并且團隊還給它起了個別具一格的昵稱——小鋼炮。
而在眾多亮點之間,最令人意外的還是小鋼炮用2B的“姿勢”所表現出來的性能。
例如與同樣是采用“以小博大”路數的大模型標桿之作Mistral-7B做比較,小鋼炮多項標準測試成績均勝出:
再把與小鋼炮同“體量”的選手拉出來,大部分能力依舊是處于領先,并且英文能力還是較為出眾的那種:
即使把Mistral-7B更大的模型拉進來同臺比擂,例如Llama2-13B、MPT-13
原文鏈接:1元=1700000tokens!清華系發布國產Mistral僅2B,老手機都帶得動,GitHub一天斬獲300+星
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...