新王Claude 3.5實測：阿里數學競賽題不給選項直接做對

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：新王Claude 3.5實測：阿里數學競賽題不給選項直接做對
關鍵字：網友,模型,大杯,系列,量子
文章來源：量子位
內容字數：0字

內容摘要：

衡宇一水發自凹非寺量子位 | 公眾號 QbitAI新鮮出爐的Claude 3.5 Sonnet，更快、更便宜，還是全球最強。
在多個關鍵指標中，GPT-4o幾乎被吊打！
網友對Claude 3.5 Sonnet和GPT-4o的橫向實測似乎也印證了官方出爐的數據。
任務是同一個：一句話，讓它們幫忙復制網站的UI。
測試者本人表示，GPT-4o這邊，給了代碼，但沒有附加任何細節。
但Claude 3.5 Sonnet刷刷刷就出色完成了任務，甚至給了與這個網站設計相匹配的細節。
訓練數據知識截止日期也更新到了2024年4月，網友實測知道今年2月的橄欖球超級碗比賽結果。
不過，這樣的大模型新王，誰能忍住不第一時間試玩一波？反正好多網友坐不住了。不到12小時過去，全網對Claude 3.5 Sonnet的測評鋪天蓋地。
玩法也越來越刁鉆，甚至有人用它重現1995年《黑客》中3D數據流的模型。
玩兒得太上頭，又怕很快達到Claude的消息容量，只能緊張地繼續玩。
Okk，好吧，所以網友的“百般刁難”下，Claude 3.5 Sonnet真的如Anthropic官方說得那么強嗎？
目前最受認可

原文鏈接：新王Claude 3.5實測：阿里數學競賽題不給選項直接做對