最強開源大模型Llama 3來了！4000億參數GPT-4，訓練數據達Llama 2七倍

AIGC動態1年前 (2024)發布智東西

最強開源大模型Llama 3來了！4000億參數狙擊GPT-4，訓練數據達Llama 2七倍

AIGC動態歡迎閱讀

原標題：最強開源大模型Llama 3來了！4000億參數 GPT-4，訓練數據達Llama 2七倍
關鍵字：模型,數據,性能,參數,效率
文章來源：智東西
內容字數：8329字

內容摘要：

開源大模型超閉源？Meta重回開源大模型鐵王座。
編譯|長頸鹿
編輯|李水青
智東西4月19日消息，昨夜，Meta推出迄今為止能力最強的開源大模型Llama 3系列，發布8B和70B兩個版本。
Llama 3在一眾榜單中取得開源SOTA（當前最優效果）。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多項基準上超過谷歌Gemma 7B和Mistral 7B Instruct。
▲Llama 3與Gemma、Mistral、Gemini、Claude 3的模型性能對比表
Llama 3 70B也在MMLU、HumanEval、GSM-8K等基準上超越了閉源的谷歌Gemini Pro 1.5、Claude 3 Sonnet。
Llama 3系列最大模型規模將超過4000億參數，英偉達科學家Jim Fan認為，這一版本未來的推出將意味開源社區的一個分水嶺，開源模型將一舉翻越GPT-4這一高峰。
▲Jim Fan對Llama 3表示贊嘆
Llama 3模型基于超過15T個token的公開數據預訓練，其中數據量是Llama 2的七倍，代碼量也增至四倍。此外，Llama

原文鏈接：最強開源大模型Llama 3來了！4000億參數GPT-4，訓練數據達Llama 2七倍