實現(xiàn)機(jī)器人領(lǐng)域的ChatGPT時刻,需要大模型+強(qiáng)化學(xué)習(xí)丨明星教授Sergey特邀報告
AIGC動態(tài)歡迎閱讀
原標(biāo)題:實現(xiàn)機(jī)器人領(lǐng)域的ChatGPT時刻,需要大模型+強(qiáng)化學(xué)習(xí)丨明星教授Sergey特邀報告
關(guān)鍵字:數(shù)據(jù),離線,模型,機(jī)器人,報告
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自智源社區(qū)
想象一下,如果想構(gòu)建一個AI系統(tǒng)來控制機(jī)器人探索另一個星球。這樣的機(jī)器人需要做些什么呢?
它需要儲備一些知識,能夠理解環(huán)境中物體之間的物理關(guān)系,還需要能處理突發(fā)。如果它要去另一個星球,我們不可能預(yù)測那里將發(fā)生的一切,所以它需要能適應(yīng)新的事物。人類在這方面做得很好,但這種靈活性和適應(yīng)性對當(dāng)前的AI系統(tǒng)來說是一個巨大的挑戰(zhàn)。
那么,最近AI的重大進(jìn)展是否有助于我們構(gòu)建這種靈活的自治系統(tǒng)呢?
在智源特邀報告中,來自加州大學(xué)伯克利分校的明星教授 Sergey Levine針對上述話題帶來了名為「Reinforcement Learning with Large Datasets: a Path to Resourceful Autonomous Agents」的精彩報告。從「離線強(qiáng)化學(xué)習(xí)基礎(chǔ)」,「機(jī)器人大模型和強(qiáng)化學(xué)習(xí)」、「基于強(qiáng)化學(xué)習(xí)的生成模型」、「離線強(qiáng)化學(xué)習(xí)與語言模型」四個方面講解了如何將基于數(shù)據(jù)的學(xué)習(xí)和優(yōu)化結(jié)合起來,實現(xiàn)更強(qiáng)大、更符合人類要求的智能體。
在過去的十年里,語言模型和擴(kuò)散模型這樣數(shù)據(jù)驅(qū)動的生成式AI是人工智能的兩大進(jìn)步。在這之前,還有像 A
原文鏈接:實現(xiàn)機(jī)器人領(lǐng)域的ChatGPT時刻,需要大模型+強(qiáng)化學(xué)習(xí)丨明星教授Sergey特邀報告
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:
作者簡介: