新王,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5
AIGC動態(tài)歡迎閱讀
原標(biāo)題:新王,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5
關(guān)鍵字:版本,方面,能力,模型,消息
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
這次不卷模型大小,只卷性能。作者丨劉潔
編輯丨岑峰
lmsys官方在發(fā)布一則消息,恭喜DeepMind研發(fā)的Gemini 1.5 Pro 實(shí)驗(yàn)版 (0801)在Chatbot Arena排名登頂,超越GPT 4o和Claude-3.5奪得第一。
這是繼今年3月Claude 3 “超大杯”O(jiān)pus版本短暫超越GPT-4以來,OpenAI第二次讓出Chatbot Arena的Overall ranking寶座。(正如我們前天說的,越來越多的大模型向OpenAI發(fā)起了沖擊)
Gemini 1.5 Pro 實(shí)驗(yàn)版 (0801)在Chatbot Arena測試一周后。獲得了超過12,000個(gè)社區(qū)投票,在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的好成績。之前說GPT-4o有刷分技巧,現(xiàn)在看起來Gemini 1.5 Pro可能也學(xué)到了這個(gè)技巧呢。
Gemini 1.5 Pro 實(shí)驗(yàn)版(0801)不僅在綜合表現(xiàn)上極為突出,在各個(gè)細(xì)分領(lǐng)域上也有著出色的表現(xiàn)。它在數(shù)學(xué)方面排名前三,指令遵循排名前二,編碼排名前五,硬提示(英語)排名前五。
Gemini 1.5
原文鏈接:新王,Gemini 1.5 Pro 再度更新,超越 GPT 4o 和 Claude-3.5
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介: