Collaborative Gym – 支持人與AI代理實時交互協(xié)作的評估框架
Collaborative Gym是什么
Collaborative Gym(簡稱Co-Gym)是一個專注于人機協(xié)作(Human-Agent Collaboration)的創(chuàng)新框架,旨在支持人類與AI代理之間的實時互動與協(xié)作。通過模擬和真實環(huán)境兩種實驗條件,Co-Gym為開發(fā)者提供了一個受控的實驗場景,方便進(jìn)行迭代開發(fā),同時也能在真實環(huán)境中評估協(xié)作效果。

Collaborative Gym的主要功能
- 異步交互支持:Co-Gym打破了傳統(tǒng)多智能體框架中同步行動的限制,使人類與AI代理能夠在協(xié)作過程中靈活發(fā)起行動,而無需遵循嚴(yán)格的交互順序,更加貼近真實的人類協(xié)作方式。
- 任務(wù)環(huán)境設(shè)計:Co-Gym將任務(wù)視為部分可觀測馬爾可夫決策過程(POMDP),并支持公共和私有觀測空間的定義。公共部分對所有參與者可見,而私有部分僅限于所有者可見,這如同人類團(tuán)隊中的共享白板與個人筆記的區(qū)別。
- 評估框架:Co-Gym不僅關(guān)注任務(wù)的最終結(jié)果,還重視協(xié)作過程本身。其綜合評估框架從協(xié)作質(zhì)量和過程兩個維度對代理進(jìn)行全面評估。
- 模擬與真實條件:Co-Gym支持在模擬與真實條件下進(jìn)行實驗。模擬條件利用預(yù)先收集的任務(wù)實例和模擬人類行為,方便快速迭代開發(fā);而真實條件則允許與真實人類在實際任務(wù)環(huán)境中進(jìn)行協(xié)作,涵蓋旅行規(guī)劃、文獻(xiàn)綜述和表格分析等多種任務(wù)。
Collaborative Gym的技術(shù)原理
- 協(xié)作驅(qū)動的環(huán)境設(shè)計:Co-Gym借鑒了OpenAI Gym的設(shè)計理念,針對人機協(xié)作進(jìn)行了優(yōu)化,支持在觀測空間中定義公共與私有部分。這種設(shè)計模擬了真實協(xié)作場景中信息共享與個人記錄的差異。
- 異步交互機制:Co-Gym的異步交互支持人類與代理在必要時行動,無需等待對方的響應(yīng)。為實現(xiàn)這一點,Co-Gym引入了兩種協(xié)作行為:發(fā)送消息(SendTeammateMessage)和等待對方繼續(xù)(WaitTeammateContinue),通過通知協(xié)議實時更新參與者對環(huán)境變化的了解。
- 通知協(xié)議:Co-Gym通過Redis服務(wù)器實現(xiàn)通知機制,支持四種類型:共享觀測更新、私有觀測變化、新消息通知以及環(huán)境不活動超時。這一機制使得代理能夠?qū)崟r監(jiān)控環(huán)境變化,從而更高效地與人類進(jìn)行協(xié)作。
- 任務(wù)環(huán)境接口(CoEnv):Co-Gym提供靈活的任務(wù)環(huán)境接口,使開發(fā)者能夠輕松添加新的任務(wù)環(huán)境。開發(fā)者只需定義任務(wù)描述、動作空間和觀測空間,即可創(chuàng)建多種任務(wù)環(huán)境,如旅行規(guī)劃、文獻(xiàn)綜述和表格數(shù)據(jù)分析。
Collaborative Gym的項目地址
- Github倉庫:https://github.com/SALT-NLP/collaborative-gym
- arXiv技術(shù)論文:https://arxiv.org/pdf/2412.15701
Collaborative Gym的應(yīng)用場景
- 旅行規(guī)劃(Travel Planning):在旅行規(guī)劃任務(wù)中,Co-Gym支持人類與AI代理共同制定詳細(xì)的行程安排。代理利用其搜索與規(guī)劃能力,而人類則提供偏好與專業(yè)知識,從而協(xié)作完成旅行計劃。
- 表格數(shù)據(jù)分析(Tabular Analysis):Co-Gym為人類和代理提供了共享的工作空間和實時溝通能力,支持高效的協(xié)作分析。
- 文獻(xiàn)綜述(Related Work):在文獻(xiàn)綜述任務(wù)中,Co-Gym幫助人類與AI代理共同整理和分析學(xué)術(shù)文獻(xiàn)。代理能夠快速檢索和篩選相關(guān)文獻(xiàn),而人類則提供領(lǐng)域內(nèi)的專業(yè)知識,協(xié)力完成高質(zhì)量的文獻(xiàn)綜述。
常見問題
- Collaborative Gym的目標(biāo)是什么? Co-Gym旨在增強人類與AI代理之間的協(xié)作能力,通過提供靈活的交互和任務(wù)環(huán)境,推動人機協(xié)作的研究與應(yīng)用。
- 如何使用Collaborative Gym? 開發(fā)者可以通過訪問Github倉庫下載Co-Gym并根據(jù)文檔創(chuàng)建自己的任務(wù)環(huán)境,進(jìn)行實驗與評估。
- 支持哪些類型的任務(wù)? Co-Gym支持多種類型的任務(wù),包括旅行規(guī)劃、文獻(xiàn)綜述和表格數(shù)據(jù)分析,適用于各種協(xié)作場景。
? 版權(quán)聲明
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關(guān)文章
暫無評論...

粵公網(wǎng)安備 44011502001135號