打通智能體「自我進(jìn)化」全流程!復(fù)旦推出通用智能體平臺(tái)AgentGym
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:打通智能體「自我進(jìn)化」全流程!復(fù)旦推出通用智能體平臺(tái)AgentGym
關(guān)鍵字:智能,環(huán)境,軌跡,任務(wù),能力
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專(zhuān)欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專(zhuān)欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.comAI通用智能體的自我進(jìn)化能力,并非遙不可及。
LLM-based Agent,已經(jīng)不再需要人類(lèi)監(jiān)督者的幫助,開(kāi)始實(shí)現(xiàn)「自我進(jìn)化」!
這個(gè)智能體在學(xué)習(xí)了專(zhuān)家軌跡以后,獲得了基礎(chǔ)的通用能力,能夠在更廣泛、更真實(shí)的未知環(huán)境與任務(wù)上進(jìn)行探索和學(xué)習(xí),在外部的反饋下不斷提升自己。
最近,復(fù)旦大學(xué)語(yǔ)言與視覺(jué)團(tuán)隊(duì)推出的 AgentGym 平臺(tái),打通了大語(yǔ)言模型智能體「數(shù)據(jù)采樣、訓(xùn)練微調(diào)、自我進(jìn)化、能力評(píng)測(cè)」全流程。基于該平臺(tái)提出的 AgentEvol 算法,首次探索了通用智能體的自我進(jìn)化能力,并在多項(xiàng)智能體任務(wù)上表現(xiàn)非凡,與 GPT-4、Claude 等 SOTA 模型比肩。論文鏈接:https://arxiv.org/abs/2406.04151?
AgentGym代碼倉(cāng)庫(kù)
原文鏈接:打通智能體「自我進(jìn)化」全流程!復(fù)旦推出通用智能體平臺(tái)AgentGym
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)
相關(guān)文章
