Agentic Context Engineering(ACE)是什么? – AI百科知識
Agentic Context Engineering(ACE)是由斯坦福大學(xué)、SambaNova Systems以及加州大學(xué)伯克利分校的研究者們共同構(gòu)思的一項(xiàng)突破性框架。該框架的核心在于動態(tài)地調(diào)整和優(yōu)化輸入信息,即所謂的“上下文”,從而顯著提升大型語言模型(LLM)的表現(xiàn)。ACE的獨(dú)特之處在于,它能夠在不改動語言模型本身參數(shù)的前提下,通過精煉輸入上下文來促使模型實(shí)現(xiàn)自我性能躍升。這一創(chuàng)新技術(shù)通過三個(gè)協(xié)同工作的模塊來實(shí)現(xiàn):生成器負(fù)責(zé)產(chǎn)出解決方案,反思器則從中提煉寶貴經(jīng)驗(yàn)教訓(xùn),而整編器則將這些經(jīng)驗(yàn)整合成一個(gè)結(jié)構(gòu)化的知識庫。ACE的出現(xiàn),有效解決了傳統(tǒng)微調(diào)方法耗時(shí)耗力的問題,同時(shí)也規(guī)避了因過度簡化上下文而可能導(dǎo)致的知識流失。實(shí)驗(yàn)結(jié)果表明,ACE在智能體任務(wù)和金融分析等多個(gè)領(lǐng)域均展現(xiàn)出卓越的性能,不僅大幅提升了表現(xiàn),還顯著降低了計(jì)算成本。這項(xiàng)技術(shù)為人工智能系統(tǒng)的持續(xù)學(xué)習(xí)能力開辟了全新的思路。
Agentic Context Engineering 究竟是什么
Agentic Context Engineering(ACE)是一種前沿的人工智能技術(shù),它賦予了語言模型在不觸及原有參數(shù)的情況下,通過優(yōu)化輸入上下文來實(shí)現(xiàn)自我性能提升的能力。它通過一個(gè)迭代的生成、反思和策劃過程,持續(xù)地積累、提煉并組織領(lǐng)域策略、代理戰(zhàn)術(shù)以及操作證據(jù)。
Agentic Context Engineering 的運(yùn)作機(jī)制
- 模塊化設(shè)計(jì):ACE框架將上下文的管理職責(zé)劃分給三個(gè)的模塊:
- 生成器(Generator):此模塊為新的智能體查詢生成推理路徑或問題解決的痕跡,它會嘗試執(zhí)行任務(wù)并探索不同的推理分支,從而揭示哪些策略是有效的,哪些是無效的。
- 反思器(Reflector):通過對比成功與失敗的推理軌跡,反思器對生成器的輸出進(jìn)行評估。它運(yùn)用自然語言進(jìn)行評估和反思,提煉出具體的領(lǐng)域洞察,不僅能識別“什么奏效”,更能 pinpoint 系統(tǒng)性失敗的根源。
- 策劃者(Curator):該模塊利用增量式、局部化的“delta”更新,將提煉出的見解整合到全局上下文存儲中。策劃者采用輕量級技術(shù),例如語義去重和確定性合并,來協(xié)調(diào)新信息與現(xiàn)有劇本,而非進(jìn)行大范圍的上下文重寫。
- 增量式 Delta 更新:ACE將上下文視為一系列結(jié)構(gòu)化的條目(bullet points)的集合,而非一個(gè)單一的、整體性的提示詞。每個(gè)條目都包含:
- 元數(shù)據(jù)(Metadata):包括一個(gè)唯一的標(biāo)識符,以及用于記錄“有用/有害”次數(shù)的計(jì)數(shù)器。
- 內(nèi)容(Content):例如可復(fù)用的策略、領(lǐng)域內(nèi)的概念,或是常見的錯(cuò)誤模式。
- 生長與精煉機(jī)制(Grow-and-Refine Mechanism):ACE通過以下方式確保上下文在持續(xù)擴(kuò)展的同時(shí),保持其精煉性和相關(guān)性:
- 生長(Grow):新的條目會被追加到上下文中,而已有的條目則通過更新元數(shù)據(jù)(如遞增計(jì)數(shù)器)進(jìn)行原地修訂。
- 精煉(Refine):通過比較條目的語義嵌入,進(jìn)行去重處理。這意味著相似的條目會被識別并合并或刪除,以減少冗余。精煉過程可以是主動的(在每次 Delta 更新后執(zhí)行),也可以是被動的(僅當(dāng)上下文窗口超出限制時(shí)觸發(fā))。
- 動態(tài)可擴(kuò)展性與低推理開銷:ACE架構(gòu)支持動態(tài)可擴(kuò)展性并保持較低的推理開銷:
- 模塊化條目結(jié)構(gòu):上下文以細(xì)粒度、可檢索和更新的“條目”列表形式進(jìn)行維護(hù),這使得有針對性的上下文策劃和運(yùn)行時(shí)的高效檢索成為可能。
- 增量更新邏輯:該機(jī)制支持快速適應(yīng)新的領(lǐng)域、工具或任務(wù)目標(biāo),而無需進(jìn)行全面的重新訓(xùn)練或系統(tǒng)級的重新部署。
- 反饋循環(huán):生成器、反思器和策劃者共同構(gòu)成了一個(gè)有效的反饋循環(huán),使得上下文能夠在不退化為無意義總結(jié)的情況下得以擴(kuò)展。這種模式允許系統(tǒng)從實(shí)際執(zhí)行軌跡中學(xué)習(xí),并在缺乏真實(shí)標(biāo)簽的情況下實(shí)現(xiàn)改進(jìn)。
Agentic Context Engineering 的主要應(yīng)用場景
- 智能體任務(wù)
- 在多輪智能體環(huán)境中,例如AppWorld,ACE通過監(jiān)控工具調(diào)用失敗和子目標(biāo)未達(dá)成的情況,自動標(biāo)記相關(guān)的策略筆記,以便進(jìn)行刪除、修訂或增強(qiáng)。這確保了領(lǐng)域知識和程序性見解能夠隨著系統(tǒng)經(jīng)驗(yàn)的積累而得到積極的策劃,從而使智能體能夠更好地適應(yīng)復(fù)雜任務(wù)。
- 在智能體任務(wù)中,ACE通過優(yōu)化上下文,使得一些規(guī)模較小的開源模型在性能上能夠媲美甚至超越更大的模型。在AppWorld排行榜上,ACE的整體平均得分與頂級的生產(chǎn)級智能體持平,并在更具挑戰(zhàn)性的測試環(huán)節(jié)中表現(xiàn)更佳。
- 領(lǐng)域特定推理:在金融領(lǐng)域,ACE通過持續(xù)積累、提煉和組織領(lǐng)域策略,優(yōu)化了上下文,使模型能夠進(jìn)行更精準(zhǔn)的領(lǐng)域特定推理,并在金融領(lǐng)域的基準(zhǔn)測試中取得了顯著的性能提升。
- 無需微調(diào)的模型演進(jìn):ACE框架實(shí)現(xiàn)了可擴(kuò)展且高效的上下文自適應(yīng)能力,適用于離線場景(如系統(tǒng)提示優(yōu)化)和在線場景(如測試時(shí)的記憶自適應(yīng))。它利用自然的執(zhí)行反饋來優(yōu)化上下文,而非依賴于標(biāo)注監(jiān)督,從而實(shí)現(xiàn)模型的自我改進(jìn)。
- 規(guī)避上下文坍縮與簡略偏見:ACE通過增量式Delta更新機(jī)制和grow-and-refine機(jī)制,有效避免了上下文坍縮和簡略偏見問題。通過局部編輯替代整體重寫,顯著降低了延遲和計(jì)算成本,并在持續(xù)擴(kuò)充上下文的同時(shí)抑制冗余,實(shí)現(xiàn)了上下文的穩(wěn)態(tài)演化。
- 提升系統(tǒng)性能與降低成本:在多項(xiàng)基準(zhǔn)測試中,ACE顯著提高了系統(tǒng)的性能,同時(shí)降低了操作延遲和部署成本。通過結(jié)構(gòu)化、增量式的更新方式,它保留了詳細(xì)的知識,并與長上下文模型協(xié)同擴(kuò)展。
- 自動化反饋驅(qū)動的自我改進(jìn):ACE利用自然的執(zhí)行反饋,而非明確的標(biāo)記監(jiān)督。生成器會記錄與目標(biāo)完成或失敗相關(guān)的上下文條目或戰(zhàn)術(shù)痕跡,反思器進(jìn)行比較分析并提煉為具體的增量更新,策劃者則將其整合到全局上下文存儲中。這種方式使得上下文能夠根據(jù)實(shí)際系統(tǒng)結(jié)果和錯(cuò)誤進(jìn)行修訂,持續(xù)地向更高的實(shí)用性對齊。
Agentic Context Engineering 面臨的挑戰(zhàn)
- 反饋質(zhì)量的依賴性:ACE框架的有效性在很大程度上依賴于高質(zhì)量的反饋來驅(qū)動上下文的改進(jìn)。如果反思器(Reflector)無法提取出有意義的見解,整個(gè)系統(tǒng)將難以實(shí)現(xiàn)有效的改進(jìn)。此外,不當(dāng)?shù)姆此继崾驹O(shè)計(jì)也可能導(dǎo)致誤導(dǎo)性模式的產(chǎn)生。
- 上下文管理的復(fù)雜性:ACE需要處理大量的上下文數(shù)據(jù),這可能會對計(jì)算資源造成壓力。特別是當(dāng)上下文窗口非常大時(shí),可能會導(dǎo)致推理時(shí)間的增加和資源消耗的上升。隨著上下文的不斷增長,如何有效地管理舊信息的更新和新信息的整合是一個(gè)關(guān)鍵問題。
- 性能與成本的權(quán)衡:雖然ACE通過增量更新機(jī)制減少了適應(yīng)延遲和計(jì)算成本,但長上下文和反思循環(huán)仍然會增加推理時(shí)間和資源消耗。上下文窗口的局限性可能導(dǎo)致模型性能下降,尤其是在處理極長的上下文時(shí)。
- 錯(cuò)誤累積與系統(tǒng)性問題:隨著時(shí)間的推移,上下文的編輯過程可能會積累微妙的錯(cuò)誤。如果對自動改進(jìn)過于自信,可能會掩蓋更深層次的推理或?qū)R問題。錯(cuò)誤的處理也是一個(gè)挑戰(zhàn),因?yàn)殡[藏的錯(cuò)誤會移除模型從錯(cuò)誤中學(xué)習(xí)的證據(jù)。
- 適應(yīng)性與靈活性的局限:ACE依賴于具備一定能力的底層模型。如果基礎(chǔ)模型本身能力不足,即使上下文不斷優(yōu)化,也很難達(dá)到理想的性能。ACE可能并非適用于所有任務(wù),對于一些簡單的問題,可能只需要簡潔的指令,而非復(fù)雜的上下文。
- 數(shù)據(jù)治理與隱私考量:在處理用戶特定或敏感數(shù)據(jù)時(shí),隱私和數(shù)據(jù)治理是至關(guān)重要的考量因素。開發(fā)者需要優(yōu)先考慮數(shù)據(jù)最小化、匿名化,并嚴(yán)格遵守相關(guān)法規(guī)(如GDPR)。
- 多模態(tài)信息的整合:現(xiàn)代智能代理通常需要處理多種類型的信息,包括文本、結(jié)構(gòu)化數(shù)據(jù)、代碼、圖像以及實(shí)時(shí)傳感器數(shù)據(jù)。將這些不同模態(tài)的信息整合到一個(gè)連貫的上下文中,是一項(xiàng)重大的工程挑戰(zhàn)。
- 評估與驗(yàn)證的必要性:若缺乏適當(dāng)?shù)脑u估,不斷演進(jìn)的智能代理可能會強(qiáng)化錯(cuò)誤的模式。持續(xù)的測試、人工驗(yàn)證以及以評估為導(dǎo)向的設(shè)計(jì)是不可或缺的。
- 上下文窗口的限制:盡管現(xiàn)代語言模型支持更大的上下文窗口,但在實(shí)際應(yīng)用中,這些窗口的大小仍然存在一定的限制。這可能導(dǎo)致模型在處理復(fù)雜任務(wù)時(shí),需要訪問的信息超出了單個(gè)上下文窗口的容量。
- KV緩存的失效問題:大型模型在處理輸入時(shí)會利用KV緩存來加速,但上下文中的微小變化(即使只是一個(gè)token的差異)都可能導(dǎo)致緩存失效,從而顯著增加延遲和成本。
Agentic Context Engineering(ACE)作為一項(xiàng)創(chuàng)新的上下文優(yōu)化框架,展現(xiàn)出廣闊的發(fā)展前景。通過生成、反思和策劃的模塊化機(jī)制,它能夠動態(tài)地更新和優(yōu)化智能系統(tǒng)的上下文,從而顯著提升性能并降低部署成本。ACE在無監(jiān)督學(xué)習(xí)場景中表現(xiàn)出強(qiáng)大的自主學(xué)習(xí)能力,它能夠在無需標(biāo)注數(shù)據(jù)的情況下適應(yīng)新任務(wù),為數(shù)據(jù)稀缺場景下的智能化提供了可行的解決方案。增量更新機(jī)制和差分更新策略,不僅有效避免了上下文坍縮和簡略偏見問題,還顯著降低了適應(yīng)延遲和部署成本,使得智能系統(tǒng)能夠在復(fù)雜環(huán)境中保持靈活性和適應(yīng)性。未來,ACE有望在多模態(tài)信息整合、提升系統(tǒng)可解釋性和透明度、以及與現(xiàn)有技術(shù)的融合等方面取得重大突破,從而推動智能代理系統(tǒng)的發(fā)展,并有望成為智能系統(tǒng)開發(fā)的標(biāo)準(zhǔn)實(shí)踐。隨著這項(xiàng)技術(shù)的普及,上下文工程師將成為一個(gè)高需求的職業(yè)角色,負(fù)責(zé)設(shè)計(jì)、優(yōu)化和維護(hù)智能系統(tǒng)的上下文,確保其在各種應(yīng)用場景中的高效運(yùn)行。

粵公網(wǎng)安備 44011502001135號