GPT-4 Turbo首次被擊??!國(guó)產(chǎn)大模型拿下總分第一
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:GPT-4 Turbo首次被擊??!國(guó)產(chǎn)大模型拿下總分第一
關(guān)鍵字:報(bào)告,模型,商湯,能力,成績(jī)
文章來源:量子位
內(nèi)容字?jǐn)?shù):7882字
內(nèi)容摘要:
金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIOpenAI長(zhǎng)期霸榜的SuperCLUE(中文大模型測(cè)評(píng)基準(zhǔn)),終于被國(guó)產(chǎn)大模型反將一軍。
事情是這樣的。
自打SuperCLUE問世以來,成績(jī)第一的選手基本上要么是GPT-4,要么是GPT-4 Turbo,來感受一下這個(gè)feel:
(PS:共有6次成績(jī),分別為2023年的9月-12月和2024年的2月、4月。)
△圖源:SuperCLUE官方但就在最近,隨著一位國(guó)產(chǎn)選手申請(qǐng)的出戰(zhàn),這一局面終是迎來了變數(shù)。
SuperCLUE團(tuán)隊(duì)對(duì)其進(jìn)行了一番全方位的綜合性測(cè)評(píng),最終官宣的成績(jī)是:
總分80.03分,超過GPT-4 Turbo的79.13分,成績(jī)第一!
△圖源:SuperCLUE官方公眾號(hào)而這位國(guó)產(chǎn)大模型選手,正是來自商湯科技的日日新5.0(SenseChat V5)。
并且SuperCLUE還給出了這樣的評(píng)價(jià):
刷新了國(guó)內(nèi)大模型最好成績(jī)。
那么商湯在SuperCLUE的這個(gè)“首次”,又是如何解鎖的呢?
綜合、文科國(guó)內(nèi)外第一,理科國(guó)內(nèi)第一首先我們來看下這次官方所搭建“擂臺(tái)”的競(jìng)技環(huán)境。
出戰(zhàn)選手:SenseChat V5(于5月11日提
原文鏈接:GPT-4 Turbo首次被擊??!國(guó)產(chǎn)大模型拿下總分第一
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破