1元=1700000tokens!清華系發(fā)布國(guó)產(chǎn)Mistral僅2B,老手機(jī)都帶得動(dòng),GitHub一天斬獲300+星
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:1元=1700000tokens!清華系發(fā)布國(guó)產(chǎn)Mistral僅2B,老手機(jī)都帶得動(dòng),GitHub一天斬獲300+星
關(guān)鍵字:小鋼炮,模型,華為,小米,報(bào)告
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):9484字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI一個(gè)體量?jī)H為2B的大模型,能有什么用?
答案可能超出你的想象。
因?yàn)槿羰怯盟膫€(gè)字來(lái)概括,那就是“多、快、好、省”:
多:它是業(yè)界第一個(gè)在端側(cè)部署多模態(tài)的大模型。
快:一張1080Ti可高效微調(diào)、一臺(tái)機(jī)器可以持續(xù)訓(xùn)練。
好:性能跟體量極具反差感,在多項(xiàng)成績(jī)中超越了一眾主流“大體量”大模型。
省:1元=1700000 tokens,成本為Mistral-Medium百分之一
那么,這個(gè)能夠“以小博大”,頗有四兩撥千斤意味的大模型,到底什么來(lái)頭?
不賣關(guān)子,它正是由清華系初創(chuàng)公司面壁智能最新發(fā)布的旗艦終端大模型——MiniCPM。
并且團(tuán)隊(duì)還給它起了個(gè)別具一格的昵稱——小鋼炮。
而在眾多亮點(diǎn)之間,最令人意外的還是小鋼炮用2B的“姿勢(shì)”所表現(xiàn)出來(lái)的性能。
例如與同樣是采用“以小博大”路數(shù)的大模型標(biāo)桿之作Mistral-7B做比較,小鋼炮多項(xiàng)標(biāo)準(zhǔn)測(cè)試成績(jī)均勝出:
再把與小鋼炮同“體量”的選手拉出來(lái),大部分能力依舊是處于領(lǐng)先,并且英文能力還是較為出眾的那種:
即使把Mistral-7B更大的模型拉進(jìn)來(lái)同臺(tái)比擂,例如Llama2-13B、MPT-13
原文鏈接:1元=1700000tokens!清華系發(fā)布國(guó)產(chǎn)Mistral僅2B,老手機(jī)都帶得動(dòng),GitHub一天斬獲300+星
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破