AIGC動態歡迎閱讀
原標題:全球最強開源模型一夜易主,1320億參數推理飆升2倍!
關鍵字:模型,基準,數據,質量,參數
文章來源:新智元
內容字數:13904字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】就在剛剛,全球最強開源大模型王座易主,創業公司Databricks發布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!這個過程只用了2個月,1000萬美元,和3100塊H100。全球最強開源模型,一夜易主!
剛剛,超級獨角獸Databricks重磅推出1320億參數的開源模型——DBRX。
它采用了細粒度MoE架構,而且每次輸入僅使用360億參數,實現了更快的每秒token吞吐量。
這種獨特的MoE架構,讓DBRX成為開源模型的SOTA,推理速度比LLaMA 2-70B快了2倍!
最重要的是,訓練成本直接砍半!只用了1000萬美元和3100塊H100,Databricks就在2個月內肝出了DBRX。
比起Meta開發Llama2所用的成本和芯片,這只是很小一部分。DBRX在語言理解、編程、數學和邏輯方面輕松擊敗了開源模型LLaMA2-70B、Mixtral,以及Grok-1。
甚至,DBRX的整體性能超越GPT-3.5。尤其在編程方面,完全擊敗了GPT-3.5。
并且,DBRX還為開放社區和企業提供了僅限于封閉模型
原文鏈接:全球最強開源模型一夜易主,1320億參數推理飆升2倍!
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...