Claude 3.7登頂編程競技場(chǎng),大幅領(lǐng)先100分!最新布料模擬實(shí)測(cè)再驚艷網(wǎng)友
官方透露Claude3.7沒那么大,訓(xùn)練花了幾千萬美元
原標(biāo)題:Claude 3.7登頂編程競技場(chǎng),大幅領(lǐng)先100分!最新布料模擬實(shí)測(cè)再驚艷網(wǎng)友
文章來源:量子位
內(nèi)容字?jǐn)?shù):2524字
Claude 3.7 Sonnet 編程能力登頂,驚艷網(wǎng)友
近日,Anthropic公司推出的Claude 3.7 Sonnet在LMArena(LMSYS Org)打造的WebDev競技場(chǎng)榜單中以絕對(duì)優(yōu)勢(shì)登頂,大幅領(lǐng)先第二名(同樣是Claude的另一個(gè)版本Claude 3.5 Sonnet)100多分。WebDev榜單與Chatbot Arena榜單類似,但更側(cè)重于AI的編程和網(wǎng)頁應(yīng)用開發(fā)能力。值得注意的是,開源模型DeepSeek R1也表現(xiàn)出色,排名第三。
Claude 3.7 Sonnet 的驚艷表現(xiàn)
Claude 3.7 Sonnet 的高分并非偶然。最近,大量網(wǎng)友實(shí)測(cè)并分享了其令人驚艷的編程能力,刷新了人們對(duì)AI編程能力的認(rèn)知。例如,它僅用幾分鐘就能用p5js編寫出布料模擬效果,這在過去需要耗費(fèi)數(shù)天時(shí)間才能完成。一位MIT碩士畢業(yè)的學(xué)者看到后,感嘆AI的進(jìn)步速度之快,甚至質(zhì)疑自身職業(yè)的未來。
布料模擬效果
網(wǎng)友不僅復(fù)現(xiàn)了該布料模擬效果,還進(jìn)一步改進(jìn),加入了明暗關(guān)系,效果更加逼真,甚至超越了高級(jí)圖形學(xué)課程的教學(xué)內(nèi)容。
Visual Basic 4 代碼轉(zhuǎn)換
一位網(wǎng)友將自己1997年用Visual Basic 4編寫的EXE文件上傳給Claude 3.7,請(qǐng)求將其轉(zhuǎn)換為Python代碼。Claude 3.7在5分鐘內(nèi)完成了轉(zhuǎn)換,并用Pygame編寫了可運(yùn)行的Python代碼,令人驚嘆。
GitHub 集成功能
Claude 3.7 的新GitHub集成功能也備受好評(píng)。它可以Fork代碼庫,選擇特定文件夾,并回答關(guān)于代碼的任何問題,還能顯示每個(gè)文件夾在上下文窗口中所占的百分比,幫助用戶理解代碼結(jié)構(gòu)和內(nèi)容。例如,它可以可視化yt-dlp(一個(gè)YouTube下載器)的工作流程。
游戲及互動(dòng)應(yīng)用開發(fā)
沃頓商學(xué)院教授Ethan Mollick也對(duì)Claude 3.7進(jìn)行了測(cè)試,例如基于“Bartleby the Scrivner”故事創(chuàng)建小游戲,以及制作互動(dòng)式“時(shí)光機(jī)道具”。他專門撰寫博客介紹了Claude 3.7的強(qiáng)大功能,Anthropic官方也對(duì)此進(jìn)行了回應(yīng),承認(rèn)Claude 3.7的模型規(guī)模并不算大,但未來的模型規(guī)模會(huì)進(jìn)一步增長。
總結(jié)
Claude 3.7 Sonnet 在WebDev競技場(chǎng)榜單的登頂,以及眾多網(wǎng)友的積極反饋,充分展現(xiàn)了其強(qiáng)大的編程能力。它不僅能夠快速高效地完成復(fù)雜的編程任務(wù),還能幫助用戶更好地理解和使用代碼,這對(duì)于軟件開發(fā)領(lǐng)域來說具有重要的意義。 未來,隨著模型規(guī)模的進(jìn)一步增長,Claude系列模型有望在AI編程領(lǐng)域取得更大的突破。
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破