3個月砸1000萬美元肝出“最強”大模型？黑馬Databricks：我們完虐Grok、Llama，還更開放

AIGC動態2年前 (2024)發布 AI前線

AIGC動態歡迎閱讀

原標題：3個月砸1000萬美元肝出“最強”大模型？黑馬Databricks：我們完虐Grok、Llama，還更開放
關鍵字：模型,報告,數據,質量,測試
文章來源：AI前線
內容字數：12370字

內容摘要：

整理 | 凌敏、核子可樂
世界最強開源大模型又雙叒叕易主了！ Databricks 推出開源大模型 DBRX
3 月 27 日，美國 AI 初創公司 Databricks 宣布，該公司 Mosaic Research 團隊開發的通用大模型 DBRX 將開源。Databricks 客戶可以通過 API 使用 DBRX，從零開始預訓練自己的 DBRX 同類模型，或者使用其構建該模型的同款工具和技術在選定的檢查點之上繼續訓練。
據悉，DBRX 的設計靈感來源于 OpenAI 的 ChatGPT。Databricks 表示，它花費了大約 1000 萬美元和三個月的時間來訓練 DBRX，并聲稱其“在標準基準上優于所有現有的開源模型”。Databricks 的首席神經網絡架構師兼 DBRX 項目負責人 Jonathan Frankle 在確認了測試結果后向團隊宣布：“我們已經超越了所有現有模型”。
量化測試結果顯示，DBRX 性能已經超越 GPT-3.5，且完全能夠與 Gemini 1.0 Pro 相比肩。其推理速度比達到 LlaMa2-70B 的 2 倍；而就總參數量和活動參數量而言，DBRX

原文鏈接：3個月砸1000萬美元肝出“最強”大模型？黑馬Databricks：我們完虐Grok、Llama，還更開放