RSS23 Best?System?Paper提名：基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)｜上海交大MVIG呂峻博士主講

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布算法邦

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：RSS23 Best?System?Paper提名：基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)｜上海交大MVIG呂峻博士主講
關(guān)鍵字：機(jī)器人,模型,猩猩,講座,建模
文章來(lái)源：算法邦
內(nèi)容字?jǐn)?shù)：2963字

內(nèi)容摘要：

智猩猩是智一科技打造的硬科技講解與服務(wù)平臺(tái)，關(guān)注AI、芯片、算力、智能網(wǎng)聯(lián)汽車、機(jī)器人，提供講座、公開課、在線研討會(huì)、峰會(huì)等線上線下產(chǎn)品。
「機(jī)器人新青年講座」由智猩猩全新企劃，旨在邀請(qǐng)全球知名高校、頂尖研究機(jī)構(gòu)以及優(yōu)秀企業(yè)的青年學(xué)者與研究人員，主講在具身智能、強(qiáng)化學(xué)習(xí)、多智能體系統(tǒng)、建模仿真等機(jī)器人關(guān)鍵技術(shù)上的研究成果和開發(fā)實(shí)踐。
有興趣講解的朋友，可以與智猩猩教研產(chǎn)品團(tuán)隊(duì)郵件（class@zhidx.com）聯(lián)系。機(jī)器人學(xué)習(xí)是具身智能領(lǐng)域中一項(xiàng)重要的研究課題。基于模型的強(qiáng)化學(xué)習(xí)（Model-based RL）是智能體在對(duì)周圍環(huán)境進(jìn)行建模的基礎(chǔ)上進(jìn)行各類操作學(xué)習(xí)，相較于無(wú)模型的強(qiáng)化學(xué)習(xí)（Model-Free RL）被認(rèn)為在樣本效率方面具有顯著優(yōu)勢(shì)。然而，如何更高效、精準(zhǔn)、自動(dòng)化地從原始傳感器信號(hào)（例如圖像信息）中建立對(duì)周邊環(huán)境的建模，并基于此學(xué)習(xí)操作技巧一直以來(lái)都是一個(gè)具有挑戰(zhàn)性的問(wèn)題。
針對(duì)當(dāng)前基于模型的強(qiáng)化學(xué)習(xí)所面臨的困境，上海交大盧策吾老師團(tuán)隊(duì)提出一種可以主動(dòng)提高感知質(zhì)量、基于模型的機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)SAM-RL。SAM-RL可以對(duì)周圍環(huán)境進(jìn)行建模并在操作過(guò)程中對(duì)模型進(jìn)行更新（

原文鏈接：RSS23 Best?System?Paper提名：基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)｜上海交大MVIG呂峻博士主講