AIGC動態歡迎閱讀
原標題:OpenAI o1全方位SOTA登頂lmsys排行榜!數學能力碾壓Claude和谷歌模型,o1-mini并列第一
關鍵字:模型,代碼,人類,領域,排行榜
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:喬楊
【新智元導讀】o1模型發布1周,lmsys的6k+投票就將o1-preview送上了排行榜榜首。同時,為了滿足大家對模型「IOI金牌水平」的好奇心,OpenAI放出了o1測評時提交的所有代碼。萬眾矚目的最新模型OpenAI o1,終于迎來了lmsys競技場的測評結果。
不出意外,o1-preview在各種領域絕對登頂,超過了最新版的GPT-4o,在數學、困難提示和編碼領域表現出色;
而o1-mini雖然名字中自帶「mini」,但也和最新版的GPT-4o并列綜合排名第二,困難提示、編碼、數學等領域和o1-preview同樣登頂第一。
果然,o1模型不愧是通用推理領域的新王。
lmsys社區官方發推表示,這項測試結果收集了6k+社區投票,并將OpenAI這次取得的進展描述為「令人難以置信的里程碑」。
單純看排行榜的排名可能不夠具有說服力,于是lmsys特意統計了總榜上前25名模型的1v1勝率。
可以看到,o1-preview對所有模型的勝率都超過了50%,對比04-09版GPT-4-Turbo的勝率最高,達到了88%。
o1-mini如果對戰o1-preview,勝
原文鏈接:OpenAI o1全方位SOTA登頂lmsys排行榜!數學能力碾壓Claude和谷歌模型,o1-mini并列第一
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...