專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮

AIGC動態2年前 (2024)發布 AI科技評論

AIGC動態歡迎閱讀

原標題：專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮
關鍵字：模型,智能,團隊,能力,參數
文章來源：AI科技評論
內容字數：14559字

內容摘要：

以小博大，面壁MiniCPM在大模型賽場上扔出了重磅。作者丨賴文昕、王悅
編輯丨陳彩嫻
2月1日，剛成立一年的面壁智能發布了兩個在海內外大模型領域「炸裂級」的存在——面壁 MiniCPM 2B 旗艦端側大模型與面壁OmniLMM多模態大模型。
MiniCPM 2B 有著當之無愧的「小鋼炮」稱號，其炸裂的點在于，從規模大小和性能來看，僅用2B 規模和1T tokens精選數據，便已在多項主流評測榜單、中英文平均成績中超越被稱為“歐洲最佳大模型”的Mistral-7B。
在與其他同等規模大模型的對比中，面壁MiniCPM表現依舊領先，大幅超越了 Llama2-7B, Mistral7B，Gemini Nano，Qwen-1.8B等一眾模型，甚至還能越級比肩 Llama2-13B、Falcon 40B和Cohere 54B此類比自己龐大數十倍規模的模型。
可以說，面壁智能這次扔出的“2B小鋼炮”，炸出了超越Mistral-7B發布的效果，展示了端側大語言模型的無限潛力
針對面壁智能本次發布的大模型成果，AI 科技評論獨家對話面壁智能 CTO 曾國洋后發現，面壁這個剛成立一年的團隊背后，是

原文鏈接：專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮

聯系作者

文章來源：AI科技評論
作者微信：aitechtalk
作者簡介：雷峰網旗下AI新媒體。聚焦AI前沿研究，關注AI工程落地。

閱讀原文

# AIGC動態 # 參數 # 團隊 # 智能 # 模型 # 能力

文章版權歸作者所有，未經允許請勿轉載。

暫無評論

暫無評論...

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮

AIGC動態歡迎閱讀

內容摘要：

聯系作者

DARPA的量子計算項目技術介紹

清華系又造大模型標桿！2B規模干翻Mistral-7B，超低成本為AI Agent護航

相關文章

暫無評論

ChatGPT

玩虛擬模特？

国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

專訪面壁曾國洋：踩過 1000 次大模型的坑后 ，造一個性能小鋼炮

AIGC動態歡迎閱讀

內容摘要：

聯系作者

DARPA的量子計算項目技術介紹

清華系又造大模型標桿！2B規模干翻Mistral-7B，超低成本為AI Agent護航

相關文章

暫無評論

ChatGPT

玩虛擬模特？

專訪面壁曾國洋：踩過 1000 次大模型的坑后，造一個性能小鋼炮

清華系又造大模型標桿！2B規模干翻Mistral-7B，超低成本為AI Agent護航

玩虛擬模特？