國產(chǎn)大模型競技場首超GPT-4o!零一萬物GLM共同躋身Top10
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:國產(chǎn)大模型競技場首超GPT-4o!零一萬物GLM共同躋身Top10
關(guān)鍵字:模型,競技場,能力,萬物,博士
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI國產(chǎn)大模型首次在公開榜單上超過GPT-4o!
就在剛剛,“大模型六小強(qiáng)”之一的零一萬物正式對外發(fā)布新旗艦?zāi)P汀猋i-Lightning(閃電)。
在大模型競技場(Chatbot Arena)上,Yi-Lightning性能直沖總榜單并列第6,數(shù)學(xué)分榜并列第3,代碼等其它分榜也名列前茅。
總成績幾乎與馬斯克最新xAI大模型Grok-2-08-13持平,超越GPT-4o-2024-05-13、GPT-4o-mini-2024-07-18、Claude 3.5 Sonnet等頂流。
同時(shí),國內(nèi)清華系大模型公司智譜AI的GLM-4-Plus也殺進(jìn)了總榜,位居第9位。
該榜單結(jié)果來自全球累積超千萬次的人類用戶盲測投票。
前段時(shí)間大模型競技場還剛剛更新了規(guī)則,新榜單對AI回答的長度和風(fēng)格等特征做了降權(quán)處理,分?jǐn)?shù)更能反映模型真正解決問題的能力。
這次Yi-Lightning殺出重圍,Lmsys團(tuán)隊(duì)特意發(fā)帖子,稱這是競技場上的大新聞:
大模型競技場總榜第六、國產(chǎn)第一細(xì)看大模型競技場分類榜上的“賽況”,Yi-Lightning各項(xiàng)能力都排在前頭。
在中
原文鏈接:國產(chǎn)大模型競技場首超GPT-4o!零一萬物GLM共同躋身Top10
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: