80頁AGENT AI綜述限時(shí)下載!李飛飛等14位學(xué)者分析智能體多模態(tài)交互的前景
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:80頁AGENT AI綜述限時(shí)下載!李飛飛等14位學(xué)者分析智能體多模態(tài)交互的前景
關(guān)鍵字:報(bào)告,智能,環(huán)境,系統(tǒng),模型
文章來源:算法邦
內(nèi)容字?jǐn)?shù):1551字
內(nèi)容摘要:
《AGENT AI: 綜述多模態(tài)交互的前沿展望》這一論文,由來自斯坦福、微軟雷蒙德研究院等高校/研究機(jī)構(gòu)的14位學(xué)者和研究人員參與撰寫。對論文資料有需求的朋友,可以在文末掃描二維碼添加小助手發(fā)送關(guān)鍵字【240124】獲取。
摘要多模態(tài)人工智能系統(tǒng)可能會(huì)成為我們?nèi)粘I钪袩o處不在的存在。使這些系統(tǒng)更具交互性的一種有前景的方法是將它們作為智能體嵌入到物理和虛擬環(huán)境中。
目前,系統(tǒng)利用現(xiàn)有的基礎(chǔ)模型作為創(chuàng)建具身智能體的基本構(gòu)建塊。將智能體嵌入這樣的環(huán)境有助于模型處理和解釋視覺和上下文數(shù)據(jù),這對于創(chuàng)建更復(fù)雜、更具上下文意識的人工智能系統(tǒng)至關(guān)重要。
例如,一個(gè)能夠感知用戶行為、人類行為、環(huán)境物體、音頻表達(dá)和場景整體情緒的系統(tǒng)可以用來通知并指導(dǎo)智能體在特定環(huán)境中的響應(yīng)。
為了加速基于智能體的多模態(tài)智能研究,我們將“智能體AI”定義為一類交互系統(tǒng),它們能夠感知視覺、語言輸入和其他基于環(huán)境的數(shù)據(jù),并能產(chǎn)生具有無限智能體的有意義的具身行動(dòng)。
特別是,我們探索旨在通過整合外部知識、多感官輸入和人類反饋來基于下一具身行動(dòng)預(yù)測改進(jìn)智能體的系統(tǒng)。我們認(rèn)為,通過在基于環(huán)境的環(huán)境中開發(fā)具有代理性的AI系統(tǒng),也可
原文鏈接:80頁AGENT AI綜述限時(shí)下載!李飛飛等14位學(xué)者分析智能體多模態(tài)交互的前景
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:「算法邦」,隸屬于智猩猩,關(guān)注大模型、生成式AI、計(jì)算機(jī)視覺三大領(lǐng)域的研究與開發(fā),提供技術(shù)文章、講座、在線研討會(huì)。