失聯(lián)大神李沐B站復(fù)更:領(lǐng)讀Llama 3.1論文,還多講了一點(diǎn)AI八卦;大模型競技場Llama 3.1排名第三
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:失聯(lián)大神李沐B站復(fù)更:領(lǐng)讀Llama 3.1論文,還多講了一點(diǎn)AI八卦;大模型競技場Llama 3.1排名第三
關(guān)鍵字:網(wǎng)友,模型,小哥,競技場,論文
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIAI大神李沐老師時(shí)隔1年多,終于回歸B站“填坑”經(jīng)典論文精讀系列了!
沒錯(cuò),最新主角兒還是Llama-3.1:
在這個(gè)18分鐘左右的視頻中,李沐老師手把手教我們讀Llama-3.1技術(shù)論文,甚至還爆料了一些八卦。(指路7分50秒左右)
他提到,Llama團(tuán)隊(duì)在訓(xùn)練最大模型時(shí),其實(shí)一開始同時(shí)訓(xùn)練了MoE模型和稠密模型,但是前者后來失敗了,所以最后只發(fā)了一個(gè)簡單版本。
更多細(xì)節(jié)大家可以去看原視頻,悄透露,李沐老師剛一上線,播放瞬間破萬了。
一大批研究僧們正聞風(fēng)趕來,瞧瞧熱一就知道大家的精神狀態(tài)了:
(視頻地址在文末領(lǐng)?。?br />與此同時(shí),大模型競技場排名更新,Llama-3.1-405B代表開源模型首次躋身競技場前三,僅次于GPT-4o和Claude-3.5-Sonnet。
當(dāng)然了,這一結(jié)果可能并不意外,Meta官方早就暗戳戳地將這幾個(gè)作了一番比較。
同樣是人類評(píng)估,Llama-3.1-405B和另外兩個(gè)打得不分上下。
另外我們看到,Llama-3.1-405B不僅整體能打,在單項(xiàng)(編碼、數(shù)學(xué)、指令遵循、硬提示)中依然牢牢占據(jù)前三。
值得一提
原文鏈接:失聯(lián)大神李沐B站復(fù)更:領(lǐng)讀Llama 3.1論文,還多講了一點(diǎn)AI八卦;大模型競技場Llama 3.1排名第三
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: