AIGC動態歡迎閱讀
原標題:性能強,成本低,運行快!最強開源大模型出現,超越ChatGPT和Llama!
關鍵字:模型,效率,任務,基準,性能
文章來源:夕小瑤科技說
內容字數:3485字
內容摘要:
夕小瑤科技說 原創作者 | 蛋糕大數據人工智能公司 Databricks放大招了!3月27日,該公司開源了通用大模型 DBRX,并聲稱該模型是迄今為止全球最強大的開源大型語言模型,比 Meta 的 Llama 2 更為強大。
Databricks CEO&創始人 Ali Ghodsi表示,DBRX不僅在測試中超過了所有先前的開源模型,而且該模型本身是一個專家混合模型(MoE),大致上擁有兩倍的計算能力(132B),但成本只有Llama2-70B的一半(36B),這使得它既聰明又廉價。并且DBRX的運行速度接近于Llama2-70B的兩倍。
DBRX 是在 12 萬億 Token 的文本和代碼上預訓練的 16×12B MoE LLM,它支持的最大上下文長度為 32k Tokens,并使用了DBRX 使用旋轉位置編碼 (RoPE)、門控線性單元 (GLU) 和分組查詢注意力 (GQA) 等技術來提高模型質量,Hugging Face 工程師 Vaibhav Srivastav 用狂野表示他對DBRX性能的震撼!
知名的機器學習專家、著名書籍《The Hundred-Page Machine
原文鏈接:性能強,成本低,運行快!最強開源大模型出現,超越ChatGPT和Llama!
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189