AIGC動態歡迎閱讀
原標題:失聯大神李沐B站復更:領讀Llama 3.1論文,還多講了一點AI八卦;大模型競技場Llama 3.1排名第三
關鍵字:網友,模型,小哥,競技場,論文
文章來源:量子位
內容字數:0字
內容摘要:
一水 發自 凹非寺量子位 | 公眾號 QbitAIAI大神李沐老師時隔1年多,終于回歸B站“填坑”經典論文精讀系列了!
沒錯,最新主角兒還是Llama-3.1:
在這個18分鐘左右的視頻中,李沐老師手把手教我們讀Llama-3.1技術論文,甚至還爆料了一些八卦。(指路7分50秒左右)
他提到,Llama團隊在訓練最大模型時,其實一開始同時訓練了MoE模型和稠密模型,但是前者后來失敗了,所以最后只發了一個簡單版本。
更多細節大家可以去看原視頻,悄透露,李沐老師剛一上線,播放瞬間破萬了。
一大批研究僧們正聞風趕來,瞧瞧熱一就知道大家的精神狀態了:
(視頻地址在文末領取)
與此同時,大模型競技場排名更新,Llama-3.1-405B代表開源模型首次躋身競技場前三,僅次于GPT-4o和Claude-3.5-Sonnet。
當然了,這一結果可能并不意外,Meta官方早就暗戳戳地將這幾個作了一番比較。
同樣是人類評估,Llama-3.1-405B和另外兩個打得不分上下。
另外我們看到,Llama-3.1-405B不僅整體能打,在單項(編碼、數學、指令遵循、硬提示)中依然牢牢占據前三。
值得一提
原文鏈接:失聯大神李沐B站復更:領讀Llama 3.1論文,還多講了一點AI八卦;大模型競技場Llama 3.1排名第三
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...