GPT-4加Agent輕松追平Devin!普林斯頓造,開源首日斬獲1.6k星
AIGC動態(tài)歡迎閱讀
原標(biāo)題:GPT-4加Agent輕松追平Devin!普林斯頓造,開源首日斬獲1.6k星
關(guān)鍵字:問題,嘉賓,模型,峰會,命令
文章來源:量子位
內(nèi)容字?jǐn)?shù):3548字
內(nèi)容摘要:
白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAI用GPT-4打造的AI程序員,結(jié)果輕松追平Devin!
普林斯頓打造的開源SWE-agent,直接開箱即用——修復(fù)GitHub存儲庫中真實(shí)bug。
在25%的SWE-bench測試集上,它實(shí)現(xiàn)了與Devin相似的準(zhǔn)確度—— 解決了12.29%的問題。
GitHub上線首日即斬獲1.6K星。不少網(wǎng)友感嘆,只需對GPT-4命令行工具進(jìn)行簡單設(shè)計,就可以讓GPT-4部分能力大幅提升。
這恰好也印證了前幾天吳恩達(dá)在演講中的觀點(diǎn):
我認(rèn)為AI Agent將在今年推動人工智能巨大進(jìn)步,甚至可能超過下一代基礎(chǔ)模型。
因?yàn)樵趨嵌鬟_(dá)的研究中,GPT-3.5的Agent比GPT-4的表現(xiàn)還要好。
如今開源版Devin現(xiàn)世,已經(jīng)有人開始RIP Devin了。
這就來看看這個開源版Devin長什么樣。
開源版Devin來了簡單來說,SWE-agent是將語言模型(比如GPT-4)轉(zhuǎn)變?yōu)檐浖こ蘟gent,來Debug GitHub存儲庫中的一些問題。
他們設(shè)計了以 LM 為中心的命令和反饋格式來實(shí)現(xiàn)這些結(jié)果,使語言模型更容易瀏覽存儲庫、查看、編輯和執(zhí)行代碼文件
原文鏈接:GPT-4加Agent輕松追平Devin!普林斯頓造,開源首日斬獲1.6k星
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破