解決真實GitHub Issue能力登頂，字節豆包MarsCode團隊分享背后工程實踐，踩過的坑也分享了

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：解決真實GitHub Issue能力登頂，字節豆包MarsCode團隊分享背后工程實踐，踩過的坑也分享了
關鍵字：代碼,豆包,行號,問題,圖譜
文章來源：量子位
內容字數：0字

內容摘要：

豆包MarsCode團隊投稿量子位 | 公眾號 QbitAI解決真實GitHub Issue的基準測試，字節家的豆包MarsCode Agent悄悄登頂了。
SWE-Bench，一個由普林斯頓大學提出的極具挑戰性的Benchmark，近期受到工業界、學術界和創業團隊的廣泛關注。
在其子集SWE-Bench Lite排行榜上，豆包MarsCode Agent近期沖上第一。
雖然這是面向所有大模型解決方案的評測，但現在排名靠前的部分已基本被AI Agent。
AI Agent即能夠感知外部環境、操作工具并具有一定自主決策能力的智能體，受到了越來越多的研究關注。
現在，豆包MarsCode Agent團隊分享了在軟件工程領域進行了一系列關于AI Agent應用的探索和嘗試：
通過構建Agent框架并為其提供代碼檢索、調試和編輯的交互接口和工具，使得Agent有可能接管部分軟件工程開發任務。
在Agent框架方面，豆包MarsCode開發了多Agent協作框架，根據所要解決軟工問題類型，分配靜態或動態求解管道，從而靈活適配多樣的軟件工程問題；
在代碼檢索能力方面，豆包MarsCode結合

原文鏈接：解決真實GitHub Issue能力登頂，字節豆包MarsCode團隊分享背后工程實踐，踩過的坑也分享了