開源模型越來越落后？Meta甩出全新Llama 3應(yīng)戰(zhàn)｜甲子光年

AIGC動(dòng)態(tài)2年前 (2024)發(fā)布甲子光年

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：開源模型越來越落后？Meta甩出全新Llama 3應(yīng)戰(zhàn)｜甲子光年
關(guān)鍵字：模型,知識(shí)產(chǎn)權(quán),數(shù)據(jù),測(cè)試,性能
文章來源：甲子光年
內(nèi)容字?jǐn)?shù)：7399字

內(nèi)容摘要：

一頭狂奔中睥睨對(duì)手的羊駝。作者｜蘇霍伊
編輯｜王博如同悶了很久，突然下的一場(chǎng)雨——Llama 3終于來了。
美國(guó)當(dāng)?shù)貢r(shí)間4月18日，Meta公司推出其開源大語言模型“Llama”（直譯是“羊駝”）系列的最新產(chǎn)品——Llama 3。更準(zhǔn)確地說，是發(fā)布了Llama 3系列的兩個(gè)版本：包含80億參數(shù)的Llama 3 8B和包含700億參數(shù)的Llama 3 70B。
Meta表示，Llama 3在性能上實(shí)現(xiàn)了重大躍遷。并稱它為“迄今為止最強(qiáng)的開源大模型”。就其參數(shù)量而言，Llama 3 8B和Llama 3 70B是目前市場(chǎng)上表現(xiàn)最佳的生成式AI模型之一，這兩款模型都是在兩個(gè)專門構(gòu)建的含24000個(gè)英偉達(dá)GPU的集群上訓(xùn)練的，在15萬億個(gè)Token上預(yù)訓(xùn)練的。
除此之外，Meta透露，他們目前正在開發(fā)一款超過4000億參數(shù)的Llama 3模型。這款模型不僅能用多種語言進(jìn)行對(duì)話，還能處理更多數(shù)據(jù)，理解圖像及其他非文本模式，力求使Llama 3系列與Hugging Face的Idefics2等開源模型保持同步。
消息一出便引起熱議，埃隆·馬斯克（Elon Musk）在楊立昆（Yann LeCun）

原文鏈接：開源模型越來越落后？Meta甩出全新Llama 3應(yīng)戰(zhàn)｜甲子光年

聯(lián)系作者

文章來源：甲子光年
作者微信：jazzyear
作者簡(jiǎn)介：甲子光年是一家科技智庫(kù)，包含智庫(kù)、社群、企業(yè)服務(wù)版塊，立足中國(guó)科技創(chuàng)新前沿陣地，動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例，推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。

閱讀原文