GPT-4加Agent輕松追平Devin！普林斯頓造，開源首日斬獲1.6k星

AIGC動態2年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：GPT-4加Agent輕松追平Devin！普林斯頓造，開源首日斬獲1.6k星
關鍵字：問題,嘉賓,模型,峰會,命令
文章來源：量子位
內容字數：3548字

內容摘要：

白交發自凹非寺量子位 | 公眾號 QbitAI用GPT-4打造的AI程序員，結果輕松追平Devin！
普林斯頓打造的開源SWE-agent，直接開箱即用——修復GitHub存儲庫中真實bug。
在25%的SWE-bench測試集上，它實現了與Devin相似的準確度—— 解決了12.29%的問題。
GitHub上線首日即斬獲1.6K星。不少網友感嘆，只需對GPT-4命令行工具進行簡單設計，就可以讓GPT-4部分能力大幅提升。
這恰好也印證了前幾天吳恩達在演講中的觀點：
我認為AI Agent將在今年推動人工智能巨大進步，甚至可能超過下一代基礎模型。
因為在吳恩達的研究中，GPT-3.5的Agent比GPT-4的表現還要好。
如今開源版Devin現世，已經有人開始RIP Devin了。
這就來看看這個開源版Devin長什么樣。
開源版Devin來了簡單來說，SWE-agent是將語言模型（比如GPT-4）轉變為軟件工程agent，來Debug GitHub存儲庫中的一些問題。
他們設計了以 LM 為中心的命令和反饋格式來實現這些結果，使語言模型更容易瀏覽存儲庫、查看、編輯和執行代碼文件

原文鏈接：GPT-4加Agent輕松追平Devin！普林斯頓造，開源首日斬獲1.6k星