3個(gè)月砸1000萬美元肝出“最強(qiáng)”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:3個(gè)月砸1000萬美元肝出“最強(qiáng)”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放
關(guān)鍵字:模型,報(bào)告,數(shù)據(jù),質(zhì)量,測(cè)試
文章來源:AI前線
內(nèi)容字?jǐn)?shù):12370字
內(nèi)容摘要:
整理 | 凌敏、核子可樂
世界最強(qiáng)開源大模型又雙叒叕易主了! Databricks 推出開源大模型 DBRX
3 月 27 日,美國(guó) AI 初創(chuàng)公司 Databricks 宣布,該公司 Mosaic Research 團(tuán)隊(duì)開發(fā)的通用大模型 DBRX 將開源。Databricks 客戶可以通過 API 使用 DBRX,從零開始預(yù)訓(xùn)練自己的 DBRX 同類模型,或者使用其構(gòu)建該模型的同款工具和技術(shù)在選定的檢查點(diǎn)之上繼續(xù)訓(xùn)練。
據(jù)悉,DBRX 的設(shè)計(jì)靈感來源于 OpenAI 的 ChatGPT。Databricks 表示,它花費(fèi)了大約 1000 萬美元和三個(gè)月的時(shí)間來訓(xùn)練 DBRX,并聲稱其“在標(biāo)準(zhǔn)基準(zhǔn)上優(yōu)于所有現(xiàn)有的開源模型”。Databricks 的首席神經(jīng)網(wǎng)絡(luò)架構(gòu)師兼 DBRX 項(xiàng)目負(fù)責(zé)人 Jonathan Frankle 在確認(rèn)了測(cè)試結(jié)果后向團(tuán)隊(duì)宣布:“我們已經(jīng)超越了所有現(xiàn)有模型”。
量化測(cè)試結(jié)果顯示,DBRX 性能已經(jīng)超越 GPT-3.5,且完全能夠與 Gemini 1.0 Pro 相比肩。其推理速度比達(dá)到 LlaMa2-70B 的 2 倍;而就總參數(shù)量和活動(dòng)參數(shù)量而言,DBRX
原文鏈接:3個(gè)月砸1000萬美元肝出“最強(qiáng)”大模型?黑馬Databricks:我們完虐Grok、Llama,還更開放
聯(lián)系作者
文章來源:AI前線
作者微信:ai-front
作者簡(jiǎn)介:面向AI愛好者、開發(fā)者和科學(xué)家,提供大模型最新資訊、AI技術(shù)分享干貨、一線業(yè)界實(shí)踐案例,助你全面擁抱AIGC。