AIGC動態歡迎閱讀
原標題:UC伯克利「LLM排位賽」結果出爐!Claude 3追平GPT-4并列第一
關鍵字:標志,符號,報告,征兆,線性
文章來源:新智元
內容字數:6663字
內容摘要:
新智元報道編輯:潤
【新智元導讀】Claude 3不但數據集跑分領先,用戶體驗上也將成為最強大的LLM,GPT-5在哪里?Claude 3和GPT-4到底誰厲害?
自從Claude 3發布以來,Anthropic官方對外宣稱的說法就是「全面超越GPT-4」,在技術報告中給出的各個測試集的數據來看,也都幾乎穩壓GPT-4-Turbo一頭。
但之前的新模型出來都要在跑分上「吊打」GPT-4,但實際體驗卻很少有真的能和GPT-4掰手腕的。
各行各業用戶試用過Claude 3,發現體驗似乎也比GPT-4要好。
在通過人類用戶打分進行排名的lmsys LLM Arena中,Claude 3在不斷積累了真實用戶反饋分數之后,排名不斷爬升。
眾所周知,這個排行榜因為是基于人類對于大模型回答的真實感受打分來排名的,對于越早初現的LLM,就能積累越多的評價,分數也越容易刷高。
所以之前出現了Claude 1.0排名高于Claude 2.0的情況,就是因為如果提升不明顯,先發布的模型得分會更有優勢。
而距離Claude 3發布一個多星期的時間,它就已經和發布了幾個月的GPT-4最新版并列第一了。
而且C
原文鏈接:UC伯克利「LLM排位賽」結果出爐!Claude 3追平GPT-4并列第一
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...