三「模」聯(lián)盟,谷歌DeepMind締造終身學(xué)習(xí)智能體!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:三「模」聯(lián)盟,谷歌DeepMind締造終身學(xué)習(xí)智能體!
關(guān)鍵字:智能,任務(wù),模型,經(jīng)驗(yàn),高效
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】打造終身學(xué)習(xí)智能體,是研究界以來一直追求的目標(biāo)。最近,帝國理工聯(lián)手谷歌DeepMind打造了創(chuàng)新聯(lián)合框架擴(kuò)散增強(qiáng)智能體(DAAG),利用LLM+VLM+DM三大模型,讓AI完成遷移學(xué)習(xí)、高效探索。為了讓AI實(shí)現(xiàn)終身學(xué)習(xí),帝國理工、谷歌DeepMind竟動(dòng)用了三大基礎(chǔ)模型!
「大模型+視覺語言模型+擴(kuò)散模型」三模并用,構(gòu)建了全新框架——擴(kuò)散增強(qiáng)智能體(DAAG)。
DAAG的誕生,就是讓具身智能體進(jìn)行遷移學(xué)習(xí)、高效探索。
最新框架利用了「后見之明經(jīng)驗(yàn)增強(qiáng)」(Hindsight Experience Augmentation)技術(shù),讓擴(kuò)散模型以時(shí)間和幾何一致的方式轉(zhuǎn)換視頻。
讓其與目標(biāo)指令對(duì)齊,從而對(duì)智能體過去經(jīng)驗(yàn)進(jìn)行重新標(biāo)記。
論文地址:https://arxiv.org/pdf/2407.20798
大模型在無需人類監(jiān)督情況下,自主協(xié)調(diào)這一過程,使其非常適合終身學(xué)習(xí)場(chǎng)景。
經(jīng)過一系列實(shí)驗(yàn),結(jié)果表明,DAAG改進(jìn)了獎(jiǎng)勵(lì)檢測(cè)器的學(xué)習(xí)、過去經(jīng)驗(yàn)的遷移以及新任務(wù)的獲取。
這些都是開發(fā)高效終身學(xué)習(xí)智能體的關(guān)鍵能力。
?無需人類監(jiān)督,AI終身強(qiáng)化學(xué)習(xí)一直以來,
原文鏈接:三「模」聯(lián)盟,谷歌DeepMind締造終身學(xué)習(xí)智能體!
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡(jiǎn)介: