專(zhuān)訪面壁曾國(guó)洋:踩過(guò) 1000 次大模型的坑后 ,造一個(gè)性能小鋼炮
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:專(zhuān)訪面壁曾國(guó)洋:踩過(guò) 1000 次大模型的坑后 ,造一個(gè)性能小鋼炮
關(guān)鍵字:模型,智能,團(tuán)隊(duì),能力,參數(shù)
文章來(lái)源:AI科技評(píng)論
內(nèi)容字?jǐn)?shù):14559字
內(nèi)容摘要:
以小博大,面壁MiniCPM在大模型賽場(chǎng)上扔出了重磅。作者丨賴文昕、王悅
編輯丨陳彩嫻
2月1日,剛成立一年的面壁智能發(fā)布了兩個(gè)在海內(nèi)外大模型領(lǐng)域「炸裂級(jí)」的存在——面壁 MiniCPM 2B 旗艦端側(cè)大模型與面壁OmniLMM多模態(tài)大模型。
MiniCPM 2B 有著當(dāng)之無(wú)愧的「小鋼炮」稱號(hào),其炸裂的點(diǎn)在于,從規(guī)模大小和性能來(lái)看,僅用2B 規(guī)模和1T tokens精選數(shù)據(jù),便已在多項(xiàng)主流評(píng)測(cè)榜單、中英文平均成績(jī)中超越被稱為“歐洲最佳大模型”的Mistral-7B。
在與其他同等規(guī)模大模型的對(duì)比中,面壁MiniCPM表現(xiàn)依舊領(lǐng)先,大幅超越了 Llama2-7B, Mistral7B,Gemini Nano,Qwen-1.8B等一眾模型,甚至還能越級(jí)比肩 Llama2-13B、Falcon 40B和Cohere 54B此類(lèi)比自己龐大數(shù)十倍規(guī)模的模型。
可以說(shuō),面壁智能這次扔出的“2B小鋼炮”,炸出了超越Mistral-7B發(fā)布的效果,展示了端側(cè)大語(yǔ)言模型的無(wú)限潛力
針對(duì)面壁智能本次發(fā)布的大模型成果,AI 科技評(píng)論獨(dú)家對(duì)話面壁智能 CTO 曾國(guó)洋后發(fā)現(xiàn),面壁這個(gè)剛成立一年的團(tuán)隊(duì)背后,是
原文鏈接:專(zhuān)訪面壁曾國(guó)洋:踩過(guò) 1000 次大模型的坑后 ,造一個(gè)性能小鋼炮
聯(lián)系作者
文章來(lái)源:AI科技評(píng)論
作者微信:aitechtalk
作者簡(jiǎn)介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。