AIGC動態歡迎閱讀
原標題:專訪面壁曾國洋:踩過 1000 次大模型的坑后 ,造一個性能小鋼炮
關鍵字:模型,智能,團隊,能力,參數
文章來源:AI科技評論
內容字數:14559字
內容摘要:
以小博大,面壁MiniCPM在大模型賽場上扔出了重磅。作者丨賴文昕、王悅
編輯丨陳彩嫻
2月1日,剛成立一年的面壁智能發布了兩個在海內外大模型領域「炸裂級」的存在——面壁 MiniCPM 2B 旗艦端側大模型與面壁OmniLMM多模態大模型。
MiniCPM 2B 有著當之無愧的「小鋼炮」稱號,其炸裂的點在于,從規模大小和性能來看,僅用2B 規模和1T tokens精選數據,便已在多項主流評測榜單、中英文平均成績中超越被稱為“歐洲最佳大模型”的Mistral-7B。
在與其他同等規模大模型的對比中,面壁MiniCPM表現依舊領先,大幅超越了 Llama2-7B, Mistral7B,Gemini Nano,Qwen-1.8B等一眾模型,甚至還能越級比肩 Llama2-13B、Falcon 40B和Cohere 54B此類比自己龐大數十倍規模的模型。
可以說,面壁智能這次扔出的“2B小鋼炮”,炸出了超越Mistral-7B發布的效果,展示了端側大語言模型的無限潛力
針對面壁智能本次發布的大模型成果,AI 科技評論獨家對話面壁智能 CTO 曾國洋后發現,面壁這個剛成立一年的團隊背后,是
原文鏈接:專訪面壁曾國洋:踩過 1000 次大模型的坑后 ,造一個性能小鋼炮
聯系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網旗下AI新媒體。聚焦AI前沿研究,關注AI工程落地。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...