三「模」聯(lián)盟,谷歌DeepMind締造終身學習智能體!

AIGC動態(tài)歡迎閱讀
原標題:三「模」聯(lián)盟,谷歌DeepMind締造終身學習智能體!
關鍵字:智能,任務,模型,經(jīng)驗,高效
文章來源:新智元
內(nèi)容字數(shù):0字
內(nèi)容摘要:
新智元報道編輯:桃子
【新智元導讀】打造終身學習智能體,是研究界以來一直追求的目標。最近,帝國理工聯(lián)手谷歌DeepMind打造了創(chuàng)新聯(lián)合框架擴散增強智能體(DAAG),利用LLM+VLM+DM三大模型,讓AI完成遷移學習、高效探索。為了讓AI實現(xiàn)終身學習,帝國理工、谷歌DeepMind竟動用了三大基礎模型!
「大模型+視覺語言模型+擴散模型」三模并用,構(gòu)建了全新框架——擴散增強智能體(DAAG)。
DAAG的誕生,就是讓具身智能體進行遷移學習、高效探索。
最新框架利用了「后見之明經(jīng)驗增強」(Hindsight Experience Augmentation)技術,讓擴散模型以時間和幾何一致的方式轉(zhuǎn)換視頻。
讓其與目標指令對齊,從而對智能體過去經(jīng)驗進行重新標記。
論文地址:https://arxiv.org/pdf/2407.20798
大模型在無需人類監(jiān)督情況下,自主協(xié)調(diào)這一過程,使其非常適合終身學習場景。
經(jīng)過一系列實驗,結(jié)果表明,DAAG改進了獎勵檢測器的學習、過去經(jīng)驗的遷移以及新任務的獲取。
這些都是開發(fā)高效終身學習智能體的關鍵能力。
?無需人類監(jiān)督,AI終身強化學習一直以來,
原文鏈接:三「模」聯(lián)盟,谷歌DeepMind締造終身學習智能體!
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載。
相關文章
暫無評論...

粵公網(wǎng)安備 44011502001135號