<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        首個AI軟件工程師Devin完整技術報告出爐,還有人用GPT做出了「復刻版」

        AIGC動態1年前 (2024)發布 機器之心
        414 0 0

        首個AI軟件工程師Devin完整技術報告出爐,還有人用GPT做出了「復刻版」

        AIGC動態歡迎閱讀

        原標題:首個AI軟件工程師Devin完整技術報告出爐,還有人用GPT做出了「復刻版」
        關鍵字:測試,問題,報告,團隊,智能
        文章來源:機器之心
        內容字數:8736字

        內容摘要:


        機器之心報道
        編輯:杜偉、大盤雞從編碼、編譯到調試、驗證,AI 智能體能做的事情更多了。這周三,Cognition AI 團隊發布的首個 AI 軟件工程師 Devin 引爆了 AI 社區,引發了人們對程序員這個職業未來前景的熱議。在對 Devin 的評估中,團隊使用了 SWE-bench。這是一個由 GitHub 問題和拉取請求組成的軟件工程系統的自動化基準測試。他們認為 SWE-bench 是一個不錯的選擇,它確定性地評估(通過單元測試)系統解決現實世界代碼庫問題的能力,并與 HumanEval 等僅限于功能的基準測試不同。
        從結果來看,在 SWE-Bench 基礎測試中,無需人類輔助,Devin 就可以解決 13.86% 的問題。而當前 SOTA 模型,在沒有人類幫忙的情況下,只能完成 1.96% 的問題。即使提供了要編輯(輔助)的確切文件,當前 SOTA 模型也只能解決 4.80% 的問題。數據集
        具體來講,SWE-bench 是一個包含 2294 個問題和 GitHub 流行開源 Python 存儲庫中拉取請求(pull request)的數據集,目的是測試系統編寫真實代碼


        原文鏈接:首個AI軟件工程師Devin完整技術報告出爐,還有人用GPT做出了「復刻版」

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 日本免费一区二区三区最新| 国产精品色拉拉免费看| 四虎AV永久在线精品免费观看| 亚洲伊人久久大香线焦| 亚洲香蕉免费有线视频| 亚洲手机中文字幕| 成人女人A级毛片免费软件| 亚洲av无码专区在线| 无码中文在线二区免费| 精品久久亚洲一级α| 亚洲国产成人久久综合区| 一个人看的www免费在线视频| 亚洲一级特黄大片无码毛片| 一级免费黄色大片| 亚洲av无码av制服另类专区| 最近中文字幕电影大全免费版| 亚洲国产精品日韩在线观看| 日韩视频在线免费观看| 色老头综合免费视频| 亚洲精品高清无码视频| 成人午夜免费福利视频| 亚洲乱亚洲乱妇24p| 亚洲免费一区二区| 91高清免费国产自产| 亚洲国产AV无码一区二区三区| 亚洲国产婷婷香蕉久久久久久 | 精品亚洲成a人在线观看| 青青草原亚洲视频| 亚洲毛片在线免费观看| 亚洲av乱码一区二区三区按摩| 亚洲片国产一区一级在线观看| 免费国产污网站在线观看15| 亚洲中文字幕人成乱码| 免费大片在线观看网站| 18禁无遮挡无码国产免费网站| 亚洲AV无码成人精品区狼人影院 | 亚洲人成小说网站色| 亚洲性日韩精品一区二区三区 | 无码不卡亚洲成?人片| 一区二区三区在线免费看| 亚洲Av永久无码精品一区二区 |