失聯大神李沐B站復更：領讀Llama 3.1論文，還多講了一點AI八卦；大模型競技場Llama 3.1排名第三

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：失聯大神李沐B站復更：領讀Llama 3.1論文，還多講了一點AI八卦；大模型競技場Llama 3.1排名第三
關鍵字：網友,模型,小哥,競技場,論文
文章來源：量子位
內容字數：0字

內容摘要：

一水發自凹非寺量子位 | 公眾號 QbitAIAI大神李沐老師時隔1年多，終于回歸B站“填坑”經典論文精讀系列了！
沒錯，最新主角兒還是Llama-3.1：
在這個18分鐘左右的視頻中，李沐老師手把手教我們讀Llama-3.1技術論文，甚至還爆料了一些八卦。（指路7分50秒左右）
他提到，Llama團隊在訓練最大模型時，其實一開始同時訓練了MoE模型和稠密模型，但是前者后來失敗了，所以最后只發了一個簡單版本。
更多細節大家可以去看原視頻，悄透露，李沐老師剛一上線，播放瞬間破萬了。
一大批研究僧們正聞風趕來，瞧瞧熱一就知道大家的精神狀態了：
（視頻地址在文末領取）
與此同時，大模型競技場排名更新，Llama-3.1-405B代表開源模型首次躋身競技場前三，僅次于GPT-4o和Claude-3.5-Sonnet。
當然了，這一結果可能并不意外，Meta官方早就暗戳戳地將這幾個作了一番比較。
同樣是人類評估，Llama-3.1-405B和另外兩個打得不分上下。
另外我們看到，Llama-3.1-405B不僅整體能打，在單項（編碼、數學、指令遵循、硬提示）中依然牢牢占據前三。
值得一提

原文鏈接：失聯大神李沐B站復更：領讀Llama 3.1論文，還多講了一點AI八卦；大模型競技場Llama 3.1排名第三