AIGC動態歡迎閱讀
原標題:解決真實GitHub Issue能力登頂,字節豆包MarsCode團隊分享背后工程實踐,踩過的坑也分享了
關鍵字:代碼,豆包,行號,問題,圖譜
文章來源:量子位
內容字數:0字
內容摘要:
豆包MarsCode團隊 投稿量子位 | 公眾號 QbitAI解決真實GitHub Issue的基準測試,字節家的豆包MarsCode Agent悄悄登頂了。
SWE-Bench,一個由普林斯頓大學提出的極具挑戰性的Benchmark,近期受到工業界、學術界和創業團隊的廣泛關注。
在其子集SWE-Bench Lite排行榜上,豆包MarsCode Agent近期沖上第一。
雖然這是面向所有大模型解決方案的評測,但現在排名靠前的部分已基本被AI Agent。
AI Agent即能夠感知外部環境、操作工具并具有一定自主決策能力的智能體,受到了越來越多的研究關注。
現在,豆包MarsCode Agent團隊分享了在軟件工程領域進行了一系列關于AI Agent應用的探索和嘗試:
通過構建Agent框架并為其提供代碼檢索、調試和編輯的交互接口和工具,使得Agent有可能接管部分軟件工程開發任務。
在Agent框架方面,豆包MarsCode開發了多Agent協作框架,根據所要解決軟工問題類型,分配靜態或動態求解管道,從而靈活適配多樣的軟件工程問題;
在代碼檢索能力方面,豆包MarsCode結合
原文鏈接:解決真實GitHub Issue能力登頂,字節豆包MarsCode團隊分享背后工程實踐,踩過的坑也分享了
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...