AIGC動態歡迎閱讀
原標題:最強開源大模型Llama 3來了!4000億參數GPT-4,訓練數據達Llama 2七倍
關鍵字:模型,數據,性能,參數,效率
文章來源:智東西
內容字數:8329字
內容摘要:
開源大模型超閉源?Meta重回開源大模型鐵王座。
編譯|長頸鹿
編輯|李水青
智東西4月19日消息,昨夜,Meta推出迄今為止能力最強的開源大模型Llama 3系列,發布8B和70B兩個版本。
Llama 3在一眾榜單中取得開源SOTA(當前最優效果)。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多項基準上超過谷歌Gemma 7B和Mistral 7B Instruct。
▲Llama 3與Gemma、Mistral、Gemini、Claude 3的模型性能對比表
Llama 3 70B也在MMLU、HumanEval、GSM-8K等基準上超越了閉源的谷歌Gemini Pro 1.5、Claude 3 Sonnet。
Llama 3系列最大模型規模將超過4000億參數,英偉達科學家Jim Fan認為,這一版本未來的推出將意味開源社區的一個分水嶺,開源模型將一舉翻越GPT-4這一高峰。
▲Jim Fan對Llama 3表示贊嘆
Llama 3模型基于超過15T個token的公開數據預訓練,其中數據量是Llama 2的七倍,代碼量也增至四倍。此外,Llama
原文鏈接:最強開源大模型Llama 3來了!4000億參數GPT-4,訓練數據達Llama 2七倍
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...