AIGC動態歡迎閱讀
原標題:最強AI程序員砸飯碗:84秒跑通代碼,像人一樣思考!團隊僅5人
關鍵字:數據,模型,團隊,過程,人類
文章來源:量子位
內容字數:0字
內容摘要:
金磊 西風 發自 凹非寺量子位 | 公眾號 QbitAI繼Devin之后,又一個AI軟件工程師被刷屏了——
它叫Genie,號稱目前地表最強,已經可以像人一樣思考和行動了!
那么這個“地表最強”,到底強到什么程度?
先來看下評測分數。
在權威榜單SWE-Bench中,Genie以解決了30.07%問題的成績奪得榜首。
(SWE-Bench是一個用來評估大模型解決現實中軟件問題的基準。)
而這個成績可謂是遙遙領先第二名19.27%,解鎖了提升SOTA的最大增幅——57%!
至于Genie的實際效果,用團隊的話來說就是:
它可以做到像人類工程師一樣解決現實生活中的軟件問題。
首先,你可以用4種方式讓Genie開始工作,分別是提示詞、GitHub Issue、Linear Ticket或者API。
以解決GitHub Issue為例,先喂給Genie一個repo的鏈接,它就開始自動解析問題了:
Genie會自動迭代思考如果想要解決這個問題它都需要哪些文件,直到它覺得找到了自己滿意的為止:
緊接著,它將對問題做一個自動迭代分析的過程:
然后Genie就開始“唰唰唰”地自動寫+跑代碼了:
?
如
原文鏈接:最強AI程序員砸飯碗:84秒跑通代碼,像人一樣思考!團隊僅5人
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...