三「模」聯(lián)盟，谷歌DeepMind締造終身學習智能體！

AIGC動態(tài)1年前 (2024)發(fā)布新智元

AIGC動態(tài)歡迎閱讀

原標題：三「模」聯(lián)盟，谷歌DeepMind締造終身學習智能體！
關鍵字：智能,任務,模型,經(jīng)驗,高效
文章來源：新智元
內(nèi)容字數(shù)：0字

內(nèi)容摘要：

新智元報道編輯：桃子
【新智元導讀】打造終身學習智能體，是研究界以來一直追求的目標。最近，帝國理工聯(lián)手谷歌DeepMind打造了創(chuàng)新聯(lián)合框架擴散增強智能體（DAAG），利用LLM+VLM+DM三大模型，讓AI完成遷移學習、高效探索。為了讓AI實現(xiàn)終身學習，帝國理工、谷歌DeepMind竟動用了三大基礎模型！
「大模型+視覺語言模型+擴散模型」三模并用，構(gòu)建了全新框架——擴散增強智能體（DAAG）。
DAAG的誕生，就是讓具身智能體進行遷移學習、高效探索。
最新框架利用了「后見之明經(jīng)驗增強」（Hindsight Experience Augmentation）技術，讓擴散模型以時間和幾何一致的方式轉(zhuǎn)換視頻。
讓其與目標指令對齊，從而對智能體過去經(jīng)驗進行重新標記。
論文地址：https://arxiv.org/pdf/2407.20798
大模型在無需人類監(jiān)督情況下，自主協(xié)調(diào)這一過程，使其非常適合終身學習場景。
經(jīng)過一系列實驗，結(jié)果表明，DAAG改進了獎勵檢測器的學習、過去經(jīng)驗的遷移以及新任務的獲取。
這些都是開發(fā)高效終身學習智能體的關鍵能力。
?無需人類監(jiān)督，AI終身強化學習一直以來，

原文鏈接：三「模」聯(lián)盟，谷歌DeepMind締造終身學習智能體！