GPT-4 Turbo首次被擊?。a(chǎn)大模型拿下總分第一
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4 Turbo首次被擊??!國產(chǎn)大模型拿下總分第一
關(guān)鍵字:報(bào)告,模型,商湯,能力,成績
文章來源:量子位
內(nèi)容字?jǐn)?shù):7882字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號 QbitAIOpenAI長期霸榜的SuperCLUE(中文大模型測評基準(zhǔn)),終于被國產(chǎn)大模型反將一軍。
事情是這樣的。
自打SuperCLUE問世以來,成績第一的選手基本上要么是GPT-4,要么是GPT-4 Turbo,來感受一下這個(gè)feel:
(PS:共有6次成績,分別為2023年的9月-12月和2024年的2月、4月。)
△圖源:SuperCLUE官方但就在最近,隨著一位國產(chǎn)選手申請的出戰(zhàn),這一局面終是迎來了變數(shù)。
SuperCLUE團(tuán)隊(duì)對其進(jìn)行了一番全方位的綜合性測評,最終官宣的成績是:
總分80.03分,超過GPT-4 Turbo的79.13分,成績第一!
△圖源:SuperCLUE官方公眾號而這位國產(chǎn)大模型選手,正是來自商湯科技的日日新5.0(SenseChat V5)。
并且SuperCLUE還給出了這樣的評價(jià):
刷新了國內(nèi)大模型最好成績。
那么商湯在SuperCLUE的這個(gè)“首次”,又是如何解鎖的呢?
綜合、文科國內(nèi)外第一,理科國內(nèi)第一首先我們來看下這次官方所搭建“擂臺”的競技環(huán)境。
出戰(zhàn)選手:SenseChat V5(于5月11日提
原文鏈接:GPT-4 Turbo首次被擊??!國產(chǎn)大模型拿下總分第一
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破