<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        ICLR 2025 | 機(jī)器人安燈泡、切東西都能拿捏,可操控軌跡跟蹤的DexTrack來了

        AIGC動態(tài)4個(gè)月前發(fā)布 機(jī)器之心
        445 0 0

        讓現(xiàn)實(shí)和唯美的科幻更近一點(diǎn),邁向通用靈巧操控技能的一小步。

        ICLR 2025 | 機(jī)器人安燈泡、切東西都能拿捏,可操控軌跡跟蹤的DexTrack來了

        原標(biāo)題:ICLR 2025 | 機(jī)器人安燈泡、切東西都能拿捏,可操控軌跡跟蹤DexTrack來了
        文章來源:機(jī)器之心
        內(nèi)容字?jǐn)?shù):4199字

        DexTrack:邁向通用靈巧操控的軌跡跟蹤方法

        本文介紹了DexTrack,一種用于實(shí)現(xiàn)通用靈巧操控的軌跡跟蹤方法。該方法旨在解決機(jī)器人靈巧操控任務(wù)中存在的挑戰(zhàn),例如任務(wù)多樣性、對特定任務(wù)的依賴以及復(fù)雜的接觸交互等。

        1. 研究動機(jī):通往通用靈巧操控的挑戰(zhàn)

        賦予機(jī)器人像人類一樣的靈巧操控能力是實(shí)現(xiàn)具身智能的關(guān)鍵一步。然而,現(xiàn)有的方法大多集中在特定技能的學(xué)習(xí)上,例如抓取或旋轉(zhuǎn)物體,難以遷移到其他任務(wù)。這些方法通常需要針對特定任務(wù)設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù),限制了通用性的實(shí)現(xiàn)。DexTrack旨在通過統(tǒng)一的任務(wù)表示和通用的軌跡跟蹤控制器來克服這一挑戰(zhàn)。

        2. DexTrack:基于軌跡跟蹤的通用方法

        DexTrack將各種靈巧操控任務(wù)統(tǒng)一表示為軌跡跟蹤任務(wù)。給定機(jī)器人手和物體的當(dāng)前狀態(tài)以及目標(biāo)狀態(tài),軌跡跟蹤控制器需要輸出相應(yīng)的動作,以使實(shí)際狀態(tài)與目標(biāo)狀態(tài)一致。這種統(tǒng)一的表示方法適用于多種操控任務(wù),例如旋轉(zhuǎn)物體或使用工具。

        DexTrack采用了一種結(jié)合強(qiáng)化學(xué)習(xí)(RL)和模仿學(xué)習(xí)(IL)的方法來訓(xùn)練通用軌跡跟蹤控制器。通過引入高質(zhì)量的軌跡跟蹤數(shù)據(jù)作為監(jiān)督信號,降低了RL訓(xùn)練的難度。同時(shí),DexTrack還利用訓(xùn)練好的控制器來改進(jìn)單一軌跡跟蹤演示的質(zhì)量,形成一個(gè)迭代優(yōu)化的過程。

        2.1 統(tǒng)一的軌跡跟蹤任務(wù)表示

        DexTrack將不同的操控任務(wù)統(tǒng)一到一個(gè)軌跡跟蹤框架下,通過規(guī)劃物體的軌跡,將任務(wù)轉(zhuǎn)化為跟蹤該軌跡的任務(wù)。這種統(tǒng)一的表示簡化了控制器的設(shè)計(jì)。

        2.2 通用軌跡的學(xué)習(xí)方法

        DexTrack的訓(xùn)練方法結(jié)合了強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí),利用高質(zhì)量的軌跡跟蹤數(shù)據(jù)作為監(jiān)督信號來輔助強(qiáng)化學(xué)習(xí)的訓(xùn)練過程。這種方法有效地提高了軌跡跟蹤控制器的學(xué)習(xí)效率和泛化能力。

        獎(jiǎng)勵(lì)函數(shù)由物體軌跡跟蹤獎(jiǎng)勵(lì)、手部軌跡跟蹤獎(jiǎng)勵(lì)和手與物體的親密度獎(jiǎng)勵(lì)三部分組成。此外,DexTrack還利用同倫優(yōu)化(homotopy optimization)來進(jìn)一步提高軌跡跟蹤的效果。

        3. 實(shí)驗(yàn)結(jié)果與分析

        DexTrack在各種具有挑戰(zhàn)性的操控任務(wù)中取得了顯著的成果,包括轉(zhuǎn)動燈泡、調(diào)整刀具角度、旋轉(zhuǎn)錘子等。實(shí)驗(yàn)結(jié)果表明,DexTrack能夠處理復(fù)雜的物體軌跡,并對噪聲具有魯棒性。此外,DexTrack也能夠泛化到未曾見過的物體和類型。

        真機(jī)實(shí)驗(yàn)驗(yàn)證了DexTrack在真實(shí)世界中的可行性,模擬器實(shí)驗(yàn)則進(jìn)一步證明了其在復(fù)雜場景下的有效性。同倫優(yōu)化方法也被證明可以有效地提高軌跡跟蹤的精度。

        4. 結(jié)論

        DexTrack提出了一種基于軌跡跟蹤的通用靈巧操控方法,通過統(tǒng)一的任務(wù)表示和結(jié)合RL和IL的訓(xùn)練方法,有效地解決了通用靈巧操控的挑戰(zhàn)。其在真實(shí)世界和模擬環(huán)境中的實(shí)驗(yàn)結(jié)果都證明了該方法的有效性和魯棒性,為未來通用靈巧操控的研究提供了新的方向。


        聯(lián)系作者

        文章來源:機(jī)器之心
        作者微信:
        作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产亚洲午夜精品| 一级做a爰全过程免费视频| 亚洲第一永久在线观看| jiz zz在亚洲| 免费看a级黄色片| 亚洲午夜在线播放| 国产免费拔擦拔擦8x| 亚洲成AV人在线播放无码| 老妇激情毛片免费| 亚洲国产天堂久久久久久| 91精品视频在线免费观看| 噜噜综合亚洲AV中文无码| 亚洲男人的天堂一区二区| 亚洲Av无码乱码在线观看性色| 日本中文字幕免费看| 亚洲精品免费在线| 456亚洲人成在线播放网站| 2020国产精品亚洲综合网| 亚洲国产韩国一区二区| 国产大片91精品免费观看男同| a级毛片免费观看视频| 亚洲天堂2017无码中文| 国产色在线|亚洲| 亚洲精品天堂成人片AV在线播放| 国产亚洲精品自在线观看| av免费不卡国产观看| 国精产品一区一区三区免费视频| 99亚洲男女激情在线观看| 亚洲日韩国产一区二区三区在线| 亚洲s色大片在线观看| 波多野结衣中文一区二区免费| 亚洲天堂免费在线| h在线观看视频免费网站| 国产午夜不卡AV免费| 国国内清清草原免费视频99| 亚洲国产精品综合一区在线| 日韩免费无码视频一区二区三区| 美女18一级毛片免费看| 免费一本色道久久一区| 成人黄软件网18免费下载成人黄18免费视频 | 亚洲人成片在线观看|