同時操控手機(jī)和電腦,100項(xiàng)任務(wù),跨系統(tǒng)智能體評測基準(zhǔn)有了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:同時操控手機(jī)和電腦,100項(xiàng)任務(wù),跨系統(tǒng)智能體評測基準(zhǔn)有了
關(guān)鍵字:任務(wù),智能,環(huán)境,基準(zhǔn),模型
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)交流與傳播。如果您有優(yōu)秀的工作想要分享,歡迎投稿或者聯(lián)系報(bào)道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com跨平臺的多模態(tài)智能體基準(zhǔn)測試 CRAB 由 CAMEL AI 社區(qū)主導(dǎo),由來自牛津、斯坦福、哈佛、KAUST、Eigent AI 等機(jī)構(gòu)的研究人員合作開發(fā)。CAMEL AI 社區(qū)開發(fā)的 CAMEL 框架是最早基于大語言模型的多智能體開源項(xiàng)目,因此社區(qū)成員多為在智能體領(lǐng)域有豐富科研和實(shí)踐經(jīng)驗(yàn)的研究者和工程師。
AI 智能體(Agent)是當(dāng)下大型語言模型社區(qū)中最為吸引人的研究方向之一,用戶只需要提出自己的需求,智能體框架便可以調(diào)度多個 LLMs 并支持多智能體(Multi-agents)以協(xié)作或競爭的方式來完成用戶給定的任務(wù)。
目前智能體已越來越多地與大型多模態(tài)模型 (MLM) 相結(jié)合,支持在各種操作系統(tǒng)( 包括網(wǎng)頁、桌面電腦和智能手機(jī)) 的圖形用戶界面( GU
原文鏈接:同時操控手機(jī)和電腦,100項(xiàng)任務(wù),跨系統(tǒng)智能體評測基準(zhǔn)有了
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡介: