AIGC動態歡迎閱讀
原標題:三「模」聯盟,谷歌DeepMind締造終身學習智能體!
關鍵字:智能,任務,模型,經驗,高效
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:桃子
【新智元導讀】打造終身學習智能體,是研究界以來一直追求的目標。最近,帝國理工聯手谷歌DeepMind打造了創新聯合框架擴散增強智能體(DAAG),利用LLM+VLM+DM三大模型,讓AI完成遷移學習、高效探索。為了讓AI實現終身學習,帝國理工、谷歌DeepMind竟動用了三大基礎模型!
「大模型+視覺語言模型+擴散模型」三模并用,構建了全新框架——擴散增強智能體(DAAG)。
DAAG的誕生,就是讓具身智能體進行遷移學習、高效探索。
最新框架利用了「后見之明經驗增強」(Hindsight Experience Augmentation)技術,讓擴散模型以時間和幾何一致的方式轉換視頻。
讓其與目標指令對齊,從而對智能體過去經驗進行重新標記。
論文地址:https://arxiv.org/pdf/2407.20798
大模型在無需人類監督情況下,自主協調這一過程,使其非常適合終身學習場景。
經過一系列實驗,結果表明,DAAG改進了獎勵檢測器的學習、過去經驗的遷移以及新任務的獲取。
這些都是開發高效終身學習智能體的關鍵能力。
?無需人類監督,AI終身強化學習一直以來,
原文鏈接:三「模」聯盟,谷歌DeepMind締造終身學習智能體!
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...