1元=1700000tokens!清華系發(fā)布國產(chǎn)Mistral僅2B,老手機(jī)都帶得動,GitHub一天斬獲300+星

AIGC動態(tài)歡迎閱讀
原標(biāo)題:1元=1700000tokens!清華系發(fā)布國產(chǎn)Mistral僅2B,老手機(jī)都帶得動,GitHub一天斬獲300+星
關(guān)鍵字:小鋼炮,模型,華為,小米,報(bào)告
文章來源:量子位
內(nèi)容字?jǐn)?shù):9484字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號 QbitAI一個體量僅為2B的大模型,能有什么用?
答案可能超出你的想象。
因?yàn)槿羰怯盟膫€字來概括,那就是“多、快、好、省”:
多:它是業(yè)界第一個在端側(cè)部署多模態(tài)的大模型。
快:一張1080Ti可高效微調(diào)、一臺機(jī)器可以持續(xù)訓(xùn)練。
好:性能跟體量極具反差感,在多項(xiàng)成績中超越了一眾主流“大體量”大模型。
省:1元=1700000 tokens,成本為Mistral-Medium百分之一
那么,這個能夠“以小博大”,頗有四兩撥千斤意味的大模型,到底什么來頭?
不賣關(guān)子,它正是由清華系初創(chuàng)公司面壁智能最新發(fā)布的旗艦終端大模型——MiniCPM。
并且團(tuán)隊(duì)還給它起了個別具一格的昵稱——小鋼炮。
而在眾多亮點(diǎn)之間,最令人意外的還是小鋼炮用2B的“姿勢”所表現(xiàn)出來的性能。
例如與同樣是采用“以小博大”路數(shù)的大模型標(biāo)桿之作Mistral-7B做比較,小鋼炮多項(xiàng)標(biāo)準(zhǔn)測試成績均勝出:
再把與小鋼炮同“體量”的選手拉出來,大部分能力依舊是處于領(lǐng)先,并且英文能力還是較為出眾的那種:
即使把Mistral-7B更大的模型拉進(jìn)來同臺比擂,例如Llama2-13B、MPT-13
原文鏈接:1元=1700000tokens!清華系發(fā)布國產(chǎn)Mistral僅2B,老手機(jī)都帶得動,GitHub一天斬獲300+星
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號