開源模型越來越落后?Meta甩出全新Llama 3應(yīng)戰(zhàn)|甲子光年

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:開源模型越來越落后?Meta甩出全新Llama 3應(yīng)戰(zhàn)|甲子光年
關(guān)鍵字:模型,知識(shí)產(chǎn)權(quán),數(shù)據(jù),測(cè)試,性能
文章來源:甲子光年
內(nèi)容字?jǐn)?shù):7399字
內(nèi)容摘要:
一頭狂奔中睥睨對(duì)手的羊駝。作者|蘇霍伊
編輯|王博如同悶了很久,突然下的一場(chǎng)雨——Llama 3終于來了。
美國(guó)當(dāng)?shù)貢r(shí)間4月18日,Meta公司推出其開源大語言模型“Llama”(直譯是“羊駝”)系列的最新產(chǎn)品——Llama 3。更準(zhǔn)確地說,是發(fā)布了Llama 3系列的兩個(gè)版本:包含80億參數(shù)的Llama 3 8B和包含700億參數(shù)的Llama 3 70B。
Meta表示,Llama 3在性能上實(shí)現(xiàn)了重大躍遷。并稱它為“迄今為止最強(qiáng)的開源大模型”。就其參數(shù)量而言,Llama 3 8B和Llama 3 70B是目前市場(chǎng)上表現(xiàn)最佳的生成式AI模型之一,這兩款模型都是在兩個(gè)專門構(gòu)建的含24000個(gè)英偉達(dá)GPU的集群上訓(xùn)練的,在15萬億個(gè)Token上預(yù)訓(xùn)練的。
除此之外,Meta透露,他們目前正在開發(fā)一款超過4000億參數(shù)的Llama 3模型。這款模型不僅能用多種語言進(jìn)行對(duì)話,還能處理更多數(shù)據(jù),理解圖像及其他非文本模式,力求使Llama 3系列與Hugging Face的Idefics2等開源模型保持同步。
消息一出便引起熱議,埃隆·馬斯克(Elon Musk)在楊立昆(Yann LeCun)
原文鏈接:開源模型越來越落后?Meta甩出全新Llama 3應(yīng)戰(zhàn)|甲子光年
聯(lián)系作者
文章來源:甲子光年
作者微信:jazzyear
作者簡(jiǎn)介:甲子光年是一家科技智庫(kù),包含智庫(kù)、社群、企業(yè)服務(wù)版塊,立足中國(guó)科技創(chuàng)新前沿陣地,動(dòng)態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級(jí)案例,推動(dòng)人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算、新能源、新材料、信息安全、大健康等科技創(chuàng)新在產(chǎn)業(yè)中的應(yīng)用與落地。

粵公網(wǎng)安備 44011502001135號(hào)