比Llama 3 推理更強的開源大模型出現(xiàn)了! Leetcode擊敗80%人類
AIGC動態(tài)歡迎閱讀
原標(biāo)題:比Llama 3 推理更強的開源大模型出現(xiàn)了! Leetcode擊敗80%人類
關(guān)鍵字:模型,數(shù)據(jù),高效,能力,性能
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):7405字
內(nèi)容摘要:
夕小瑤科技說 分享Llama3 最近實在太火了!
它的性能匹敵 Gemini 1.5 Pro,接近GPT-4,贏得了“最強開源大模型”的稱號。
國內(nèi)外開源社區(qū)都為之感到振奮,果然開源大模型還是只能仰賴大洋彼岸的Meta嗎?
其實不然,筆者驚喜地發(fā)現(xiàn)在國內(nèi)竟然有一家比 Llama3 更早的開源大模型SOTA創(chuàng)造者——面壁智能!
沒錯,就在 Llama3 發(fā)布(4 月 18 日)的前兩天,面壁智能已經(jīng)低調(diào)地開源了綜合性能不輸于 Llama3的大模型Eurux-8x22B。它在代碼和數(shù)學(xué)等體現(xiàn)大模型核心素質(zhì)的復(fù)雜推理綜合性能方面超越 Llama3-70B,刷新開源大模型 SOTA,堪稱「理科狀元」。
不僅開源時間早于LlaMa3,Eurux-8x22B的激活參數(shù)僅有39B,推理速度更快,且目前支持 64k上下文,相比 Llama3-70B的8K上下文更具優(yōu)勢。
一句話總結(jié):Eurux-8x22B 相比 Llama3-70B 更快、更長、理科更好!
此外,Eurux-8x22B 由 Mistral-8x22B 對齊而來,綜合性能不輸 Llama3-70B。
Eurux-8×22簡直太牛了!這不
原文鏈接:比Llama 3 推理更強的開源大模型出現(xiàn)了! Leetcode擊敗80%人類
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業(yè)、有趣、深度價值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實驗室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189