大模型一對(duì)一戰(zhàn)斗75萬(wàn)輪,GPT-4奪冠,Llama 3位列第五
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:大模型一對(duì)一戰(zhàn)斗75萬(wàn)輪,GPT-4奪冠,Llama 3位列第五
關(guān)鍵字:模型,版本,測(cè)試,大杯,英文
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3916字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI關(guān)于Llama 3,又有測(cè)試結(jié)果新鮮出爐——
大模型評(píng)測(cè)社區(qū)LMSYS發(fā)布了一份大模型排行榜單,Llama 3位列第五,英文單項(xiàng)與GPT-4并列第一。
不同于其他Benchmark,這份榜單的依據(jù)是模型一對(duì)一battle,由全網(wǎng)測(cè)評(píng)者自行命題并打分。
最終,Llama 3取得了榜單中的第五名,排在前面的是GPT-4的三個(gè)不同版本,以及Claude 3超大杯Opus。
而在英文單項(xiàng)榜單中,Llama 3反超了Claude,與GPT-4打成了平手。
對(duì)于這一結(jié)果,Meta的首席科學(xué)家LeCun十分高興,轉(zhuǎn)發(fā)了推文并留下了一個(gè)“Nice”。
PyTorch之父Soumith Chintala也激動(dòng)地表示,這樣的成果令人難以置信,對(duì)Meta感到驕傲。
Llama 3的400B版本還沒(méi)出來(lái),單靠70B參數(shù)就獲得了第五名……我還記得去年三月GPT-4發(fā)布的時(shí)候,達(dá)到與之相同的表現(xiàn)幾乎是一件不可能的事?!F(xiàn)在AI的普及化實(shí)在是令人難以置信,我對(duì)Meta AI的同仁們做出這樣的成功感到非常驕傲。
那么,這份榜單具體展示了什么樣的結(jié)果呢?
近90個(gè)模
原文鏈接:大模型一對(duì)一戰(zhàn)斗75萬(wàn)輪,GPT-4奪冠,Llama 3位列第五
聯(lián)系作者
文章來(lái)源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破