RSS23 Best?System?Paper提名:基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)|上海交大MVIG呂峻博士主講
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:RSS23 Best?System?Paper提名:基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)|上海交大MVIG呂峻博士主講
關(guān)鍵字:機(jī)器人,模型,猩猩,講座,建模
文章來(lái)源:算法邦
內(nèi)容字?jǐn)?shù):2963字
內(nèi)容摘要:
智猩猩是智一科技打造的硬科技講解與服務(wù)平臺(tái),關(guān)注AI、芯片、算力、智能網(wǎng)聯(lián)汽車、機(jī)器人,提供講座、公開課、在線研討會(huì)、峰會(huì)等線上線下產(chǎn)品。
「機(jī)器人新青年講座」由智猩猩全新企劃,旨在邀請(qǐng)全球知名高校、頂尖研究機(jī)構(gòu)以及優(yōu)秀企業(yè)的青年學(xué)者與研究人員,主講在具身智能、強(qiáng)化學(xué)習(xí)、多智能體系統(tǒng)、建模仿真等機(jī)器人關(guān)鍵技術(shù)上的研究成果和開發(fā)實(shí)踐。
有興趣講解的朋友,可以與智猩猩教研產(chǎn)品團(tuán)隊(duì)郵件(class@zhidx.com)聯(lián)系。機(jī)器人學(xué)習(xí)是具身智能領(lǐng)域中一項(xiàng)重要的研究課題。基于模型的強(qiáng)化學(xué)習(xí)(Model-based RL)是智能體在對(duì)周圍環(huán)境進(jìn)行建模的基礎(chǔ)上進(jìn)行各類操作學(xué)習(xí),相較于無(wú)模型的強(qiáng)化學(xué)習(xí)(Model-Free RL)被認(rèn)為在樣本效率方面具有顯著優(yōu)勢(shì)。然而,如何更高效、精準(zhǔn)、自動(dòng)化地從原始傳感器信號(hào)(例如圖像信息)中建立對(duì)周邊環(huán)境的建模,并基于此學(xué)習(xí)操作技巧一直以來(lái)都是一個(gè)具有挑戰(zhàn)性的問(wèn)題。
針對(duì)當(dāng)前基于模型的強(qiáng)化學(xué)習(xí)所面臨的困境,上海交大盧策吾老師團(tuán)隊(duì)提出一種可以主動(dòng)提高感知質(zhì)量、基于模型的機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)SAM-RL。SAM-RL可以對(duì)周圍環(huán)境進(jìn)行建模并在操作過(guò)程中對(duì)模型進(jìn)行更新(
原文鏈接:RSS23 Best?System?Paper提名:基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)|上海交大MVIG呂峻博士主講
聯(lián)系作者
文章來(lái)源:算法邦
作者微信:allplusai
作者簡(jiǎn)介:「算法邦」,隸屬于智猩猩,關(guān)注大模型、生成式AI、計(jì)算機(jī)視覺三大領(lǐng)域的研究與開發(fā),提供技術(shù)文章、講座、在線研討會(huì)。