AIGC動態歡迎閱讀
原標題:2B參數性能超Mistral-7B:面壁智能多模態端側模型開源
關鍵字:模型,智能,報告,性能,參數
文章來源:機器之心
內容字數:4086字
內容摘要:
機器之心報道
編輯:澤南千元機也能本地運行。在大模型不斷向著大體量方向前進的同時,最近一段時間,人們在優化和部署方面也取得了成果。
2 月 1 日,面壁智能聯合清華 NLP 實驗室在北京正式發布了旗艦端側大模型「面壁 MiniCPM」。新一代大模型被稱為「性能小鋼炮」,直接擁抱終端部署,同時也具有同量級最強的多模態能力。
面壁智能本次提出的 MiniCPM 2B 參數量僅有 20 億,使用 1T token 的精選數據訓練。這是一個參數量上與 2018 年 BERT 同級的模型,面壁智能在其之上實現了極致的性能優化與成本控制,讓該模型可以「越級打怪」。
面壁智能聯合創始人、CEO 李大海將新模型與業內知名開源大模型 Mistral-7B 進行了對比,在多項主流評測榜單上,MiniCPM 2B 的性能全面超越了后者。與微軟近期提出的「小模型」Phi-2 相比,MiniCPM 也有很大優勢。李大海表示,面壁智能的新模型還能越級實現 13B、30B 甚至 40B 模型的能力。在最接近用戶體驗的評測榜單 MT-Bench 上,MiniCPM 取得了 7 分的成績(GPT-4-Turbo 為 9
原文鏈接:2B參數性能超Mistral-7B:面壁智能多模態端側模型開源
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...