AIGC動態歡迎閱讀
原標題:GPT-4 Turbo首次被擊敗!國產大模型拿下總分第一
關鍵字:報告,模型,商湯,能力,成績
文章來源:量子位
內容字數:7882字
內容摘要:
金磊 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI長期霸榜的SuperCLUE(中文大模型測評基準),終于被國產大模型反將一軍。
事情是這樣的。
自打SuperCLUE問世以來,成績第一的選手基本上要么是GPT-4,要么是GPT-4 Turbo,來感受一下這個feel:
(PS:共有6次成績,分別為2023年的9月-12月和2024年的2月、4月。)
△圖源:SuperCLUE官方但就在最近,隨著一位國產選手申請的出戰,這一局面終是迎來了變數。
SuperCLUE團隊對其進行了一番全方位的綜合性測評,最終官宣的成績是:
總分80.03分,超過GPT-4 Turbo的79.13分,成績第一!
△圖源:SuperCLUE官方公眾號而這位國產大模型選手,正是來自商湯科技的日日新5.0(SenseChat V5)。
并且SuperCLUE還給出了這樣的評價:
刷新了國內大模型最好成績。
那么商湯在SuperCLUE的這個“首次”,又是如何解鎖的呢?
綜合、文科國內外第一,理科國內第一首先我們來看下這次官方所搭建“擂臺”的競技環境。
出戰選手:SenseChat V5(于5月11日提
原文鏈接:GPT-4 Turbo首次被擊敗!國產大模型拿下總分第一
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...