大模型一對一戰(zhàn)斗75萬輪，GPT-4奪冠，Llama 3位列第五

AIGC動態(tài)1年前 (2024)發(fā)布量子位

AIGC動態(tài)歡迎閱讀

原標(biāo)題：大模型一對一戰(zhàn)斗75萬輪，GPT-4奪冠，Llama 3位列第五
關(guān)鍵字：模型,版本,測試,大杯,英文
文章來源：量子位
內(nèi)容字?jǐn)?shù)：3916字

內(nèi)容摘要：

克雷西發(fā)自凹非寺量子位 | 公眾號 QbitAI關(guān)于Llama 3，又有測試結(jié)果新鮮出爐——
大模型評測社區(qū)LMSYS發(fā)布了一份大模型排行榜單，Llama 3位列第五，英文單項(xiàng)與GPT-4并列第一。
不同于其他Benchmark，這份榜單的依據(jù)是模型一對一battle，由全網(wǎng)測評者自行命題并打分。
最終，Llama 3取得了榜單中的第五名，排在前面的是GPT-4的三個不同版本，以及Claude 3超大杯Opus。
而在英文單項(xiàng)榜單中，Llama 3反超了Claude，與GPT-4打成了平手。
對于這一結(jié)果，Meta的首席科學(xué)家LeCun十分高興，轉(zhuǎn)發(fā)了推文并留下了一個“Nice”。
PyTorch之父Soumith Chintala也激動地表示，這樣的成果令人難以置信，對Meta感到驕傲。
Llama 3的400B版本還沒出來，單靠70B參數(shù)就獲得了第五名……我還記得去年三月GPT-4發(fā)布的時候，達(dá)到與之相同的表現(xiàn)幾乎是一件不可能的事。……現(xiàn)在AI的普及化實(shí)在是令人難以置信，我對Meta AI的同仁們做出這樣的成功感到非常驕傲。
那么，這份榜單具體展示了什么樣的結(jié)果呢？
近90個模

原文鏈接：大模型一對一戰(zhàn)斗75萬輪，GPT-4奪冠，Llama 3位列第五