截胡OpenAI!清華復(fù)旦等搶先開源智能體框架Eko,一句話打造「虛擬員工」
原標(biāo)題:截胡OpenAI!清華復(fù)旦等搶先開源智能體框架Eko,一句話打造「虛擬員工」
文章來源:新智元
內(nèi)容字?jǐn)?shù):6728字
Eko:革新生產(chǎn)級(jí)智能體開發(fā)框架
本文概要介紹Eko,一個(gè)由清華、復(fù)旦和斯坦福的研究者聯(lián)合開發(fā)的Agent開發(fā)框架。Eko旨在幫助開發(fā)者快速構(gòu)建可用于生產(chǎn)環(huán)境的“虛擬員工”,以自動(dòng)化完成各種任務(wù),從簡(jiǎn)單的指令到復(fù)雜的工作流程。它通過創(chuàng)新技術(shù),實(shí)現(xiàn)了高效、靈活且安全的自動(dòng)化工作流程,搶先一步超越了OpenAI計(jì)劃于2025年推出的“虛擬員工計(jì)劃”O(jiān)perator。
核心技術(shù)創(chuàng)新
Eko的三大核心技術(shù)創(chuàng)新使其脫穎而出:
1. 混合智能體表示 (Mixed Agentic representation):Eko無縫結(jié)合了自然語言(高層次設(shè)計(jì))和程序語言(低層次實(shí)現(xiàn)),簡(jiǎn)化了開發(fā)流程。開發(fā)者可以使用自然語言描述任務(wù),同時(shí)利用代碼實(shí)現(xiàn)細(xì)節(jié)控制。
2. 跨平臺(tái)Agent框架:Eko采用環(huán)境感知架構(gòu),支持瀏覽器、電腦以及瀏覽器插件等多種平臺(tái),開發(fā)者只需編寫一套代碼即可在不同環(huán)境中運(yùn)行。
3. 生產(chǎn)級(jí)干預(yù)機(jī)制:不同于強(qiáng)調(diào)完全自主性的現(xiàn)有Agent框架,Eko提供了顯性的生產(chǎn)級(jí)干預(yù)機(jī)制,允許開發(fā)者隨時(shí)中斷和調(diào)整智能體的工作流程,確保對(duì)生產(chǎn)環(huán)境的有效監(jiān)管和控制。
易用性與實(shí)際應(yīng)用
Eko的易用性令人印象深刻。只需一句話,即可讓Eko生成一個(gè)完整的Agent來執(zhí)行復(fù)雜任務(wù),例如股票分析或自動(dòng)化測(cè)試。例如,一句“在雅虎財(cái)經(jīng)上收集納斯達(dá)克的最新數(shù)據(jù),包括主要股票的價(jià)格變化、市值、交易量,分析數(shù)據(jù)并生成可視化報(bào)告”就能啟動(dòng)一個(gè)完整的股票分析Agent。
文章還提供了當(dāng)前登錄頁面自動(dòng)化測(cè)試的例子,展示了Eko如何輕松處理復(fù)雜的測(cè)試流程,并生成測(cè)試報(bào)告。
架構(gòu)設(shè)計(jì)
Eko的跨平臺(tái)能力源于其環(huán)境感知架構(gòu),該架構(gòu)由三個(gè)關(guān)鍵層次構(gòu)成:
1. 通用核心 (Universal Core):提供與環(huán)境無關(guān)的基本功能,如工作流管理、工具注冊(cè)管理、LLM集成和鉤子系統(tǒng)。
2. 環(huán)境特定工具 (Environment-Specific Tools):為每種環(huán)境(瀏覽器擴(kuò)展、Web環(huán)境、Node.js環(huán)境等)提供優(yōu)化的工具集。
3. 環(huán)境橋接 (Environment Bridge):負(fù)責(zé)環(huán)境檢測(cè)、工具注冊(cè)、資源管理和安全控制,確保不同平臺(tái)間的順利交互。
安全性和訪問控制
Eko在安全性方面也考慮周全。它針對(duì)不同環(huán)境實(shí)施了適當(dāng)?shù)陌踩胧鐬g覽器擴(kuò)展和Web環(huán)境采用嚴(yán)格的權(quán)限控制和API密鑰管理,而Node.js環(huán)境則基于用戶權(quán)限進(jìn)行文件操作和命令執(zhí)行,并提供執(zhí)行前的用戶確認(rèn)機(jī)制。
層次化規(guī)劃與優(yōu)化
Eko采用層次化感知框架,將任務(wù)拆解為Planning layer和Execution layer。Planning layer負(fù)責(zé)將用戶需求分解成任務(wù)圖,Execution layer則根據(jù)任務(wù)圖調(diào)用LLM合成具體的執(zhí)行行為和工具調(diào)用。Eko還實(shí)現(xiàn)了多步合并優(yōu)化,提高了推理速度。
視覺-交互要素聯(lián)合感知 (VIEP)
Eko的VIEP技術(shù)顯著提升了瀏覽器自動(dòng)化任務(wù)的準(zhǔn)確性和效率。它通過結(jié)合視覺識(shí)別和元素上下文信息,精確定位并操作網(wǎng)頁交互元素,并通過生成精簡(jiǎn)的偽HTML結(jié)構(gòu),降低了資源消耗和處理難度,大幅提升了自動(dòng)化操作的處理速度和精準(zhǔn)度。
生產(chǎn)級(jí)的可干預(yù)機(jī)制
Eko的鉤子系統(tǒng)允許開發(fā)者在工作流執(zhí)行前后插入自定義邏輯,從而實(shí)現(xiàn)對(duì)自動(dòng)化流程的監(jiān)控、調(diào)整和干預(yù)。它提供了三種不同層級(jí)的鉤子:工作流鉤子、子任務(wù)鉤子以及工具鉤子,滿足不同的監(jiān)控和干預(yù)需求。
總結(jié)
Eko是一個(gè)功能強(qiáng)大且易于使用的Agent開發(fā)框架,它為開發(fā)者提供了構(gòu)建生產(chǎn)級(jí)“虛擬員工”的有效工具,顯著提升工作效率和質(zhì)量。其創(chuàng)新技術(shù)和易用性使其成為自動(dòng)化領(lǐng)域的一大進(jìn)步。
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡(jiǎn)介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。