AIGC動態歡迎閱讀
原標題:新王Claude 3.5實測:阿里數學競賽題不給選項直接做對
關鍵字:網友,模型,大杯,系列,量子
文章來源:量子位
內容字數:0字
內容摘要:
衡宇 一水 發自 凹非寺量子位 | 公眾號 QbitAI新鮮出爐的Claude 3.5 Sonnet,更快、更便宜,還是全球最強。
在多個關鍵指標中,GPT-4o幾乎被吊打!
網友對Claude 3.5 Sonnet和GPT-4o的橫向實測似乎也印證了官方出爐的數據。
任務是同一個:一句話,讓它們幫忙復制網站的UI。
測試者本人表示,GPT-4o這邊,給了代碼,但沒有附加任何細節。
但Claude 3.5 Sonnet刷刷刷就出色完成了任務,甚至給了與這個網站設計相匹配的細節。
訓練數據知識截止日期也更新到了2024年4月,網友實測知道今年2月的橄欖球超級碗比賽結果。
不過,這樣的大模型新王,誰能忍住不第一時間試玩一波?反正好多網友坐不住了。不到12小時過去,全網對Claude 3.5 Sonnet的測評鋪天蓋地。
玩法也越來越刁鉆,甚至有人用它重現1995年《黑客》中3D數據流的模型。
玩兒得太上頭,又怕很快達到Claude的消息容量,只能緊張地繼續玩。
Okk,好吧,所以網友的“百般刁難”下,Claude 3.5 Sonnet真的如Anthropic官方說得那么強嗎?
目前最受認可
原文鏈接:新王Claude 3.5實測:阿里數學競賽題不給選項直接做對
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...