AIGC動態歡迎閱讀
原標題:3個月砸1000萬美元肝出“最強”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放
關鍵字:模型,報告,數據,質量,測試
文章來源:AI前線
內容字數:12370字
內容摘要:
整理 | 凌敏、核子可樂
世界最強開源大模型又雙叒叕易主了! Databricks 推出開源大模型 DBRX
3 月 27 日,美國 AI 初創公司 Databricks 宣布,該公司 Mosaic Research 團隊開發的通用大模型 DBRX 將開源。Databricks 客戶可以通過 API 使用 DBRX,從零開始預訓練自己的 DBRX 同類模型,或者使用其構建該模型的同款工具和技術在選定的檢查點之上繼續訓練。
據悉,DBRX 的設計靈感來源于 OpenAI 的 ChatGPT。Databricks 表示,它花費了大約 1000 萬美元和三個月的時間來訓練 DBRX,并聲稱其“在標準基準上優于所有現有的開源模型”。Databricks 的首席神經網絡架構師兼 DBRX 項目負責人 Jonathan Frankle 在確認了測試結果后向團隊宣布:“我們已經超越了所有現有模型”。
量化測試結果顯示,DBRX 性能已經超越 GPT-3.5,且完全能夠與 Gemini 1.0 Pro 相比肩。其推理速度比達到 LlaMa2-70B 的 2 倍;而就總參數量和活動參數量而言,DBRX
原文鏈接:3個月砸1000萬美元肝出“最強”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放
聯系作者
文章來源:AI前線
作者微信:ai-front
作者簡介:面向AI愛好者、開發者和科學家,提供大模型最新資訊、AI技術分享干貨、一線業界實踐案例,助你全面擁抱AIGC。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...