新王Claude 3.5實測:阿里數(shù)學(xué)競賽題不給選項直接做對
AIGC動態(tài)歡迎閱讀
原標題:新王Claude 3.5實測:阿里數(shù)學(xué)競賽題不給選項直接做對
關(guān)鍵字:網(wǎng)友,模型,大杯,系列,量子
文章來源:量子位
內(nèi)容字數(shù):0字
內(nèi)容摘要:
衡宇 一水 發(fā)自 凹非寺量子位 | 公眾號 QbitAI新鮮出爐的Claude 3.5 Sonnet,更快、更便宜,還是全球最強。
在多個關(guān)鍵指標中,GPT-4o幾乎被吊打!
網(wǎng)友對Claude 3.5 Sonnet和GPT-4o的橫向?qū)崪y似乎也印證了官方出爐的數(shù)據(jù)。
任務(wù)是同一個:一句話,讓它們幫忙復(fù)制網(wǎng)站的UI。
測試者本人表示,GPT-4o這邊,給了代碼,但沒有附加任何細節(jié)。
但Claude 3.5 Sonnet刷刷刷就出色完成了任務(wù),甚至給了與這個網(wǎng)站設(shè)計相匹配的細節(jié)。
訓(xùn)練數(shù)據(jù)知識截止日期也更新到了2024年4月,網(wǎng)友實測知道今年2月的橄欖球超級碗比賽結(jié)果。
不過,這樣的大模型新王,誰能忍住不第一時間試玩一波?反正好多網(wǎng)友坐不住了。不到12小時過去,全網(wǎng)對Claude 3.5 Sonnet的測評鋪天蓋地。
玩法也越來越刁鉆,甚至有人用它重現(xiàn)1995年《黑客》中3D數(shù)據(jù)流的模型。
玩兒得太上頭,又怕很快達到Claude的消息容量,只能緊張地繼續(xù)玩。
Okk,好吧,所以網(wǎng)友的“百般刁難”下,Claude 3.5 Sonnet真的如Anthropic官方說得那么強嗎?
目前最受認可
原文鏈接:新王Claude 3.5實測:阿里數(shù)學(xué)競賽題不給選項直接做對
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破