<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        探索具身導(dǎo)航的未來(lái):三維場(chǎng)景理解的突破與應(yīng)用

        AIGC動(dòng)態(tài)10個(gè)月前發(fā)布 智猩猩GenAI
        400 0 0

        新加坡國(guó)立大學(xué)計(jì)算機(jī)學(xué)院博士生王子涵主講~

        探索具身導(dǎo)航的未來(lái):三維場(chǎng)景理解的突破與應(yīng)用

        原標(biāo)題:CVPR具身智能視覺(jué)語(yǔ)言導(dǎo)航RxR競(jìng)賽冠軍方案一作開(kāi)講!主講具身導(dǎo)航中的三維場(chǎng)景理解 | 講座預(yù)告
        文章來(lái)源:智猩猩GenAI
        內(nèi)容字?jǐn)?shù):4041字

        具身導(dǎo)航中的三維場(chǎng)景理解

        具身智能體的視覺(jué)導(dǎo)航能力是實(shí)現(xiàn)智能體在復(fù)雜環(huán)境中自主行動(dòng)的重要基礎(chǔ)。近年來(lái),基于開(kāi)放域語(yǔ)言指令的視覺(jué)語(yǔ)言導(dǎo)航任務(wù)逐漸成為研究的熱點(diǎn),因其在實(shí)際應(yīng)用中的挑戰(zhàn)性和價(jià)值巨大。本文將重點(diǎn)介紹相關(guān)研究成果,尤其是在三維環(huán)境表征和理解方面的進(jìn)展。

        1. 具身導(dǎo)航的核心難點(diǎn)與基礎(chǔ)方法介紹

        具身導(dǎo)航面臨諸多挑戰(zhàn),包括理解單個(gè)物體、物體間關(guān)系以及空間布局。這要求智能體能夠?qū)崟r(shí)更新環(huán)境表征,并與語(yǔ)言指令進(jìn)行有效對(duì)齊。傳統(tǒng)方法如低噪聲點(diǎn)云的3D Visual Grounding在復(fù)雜環(huán)境中效果有限,因此需要?jiǎng)?chuàng)新的解決方案。

        2. 動(dòng)態(tài)構(gòu)建地圖表征方法GridMM

        中科院計(jì)算所與新加坡國(guó)立大學(xué)的研究團(tuán)隊(duì)提出了GridMM,這是一種動(dòng)態(tài)構(gòu)建與語(yǔ)言指令細(xì)粒度對(duì)齊的網(wǎng)格記憶地圖。GridMM通過(guò)將智能體觀察到的視覺(jué)特征映射到俯視角網(wǎng)格地圖,并在每個(gè)網(wǎng)格區(qū)域內(nèi)與導(dǎo)航指令進(jìn)行語(yǔ)義關(guān)聯(lián),從而實(shí)現(xiàn)環(huán)境表征的實(shí)時(shí)更新。該方法在ICCV 2023上獲得認(rèn)可,并成為CVPR 2023 Embodied AI視覺(jué)語(yǔ)言導(dǎo)航RxR競(jìng)賽的冠軍方案。

        3. 基于特征場(chǎng)的導(dǎo)航前瞻探索策略HNR

        另一項(xiàng)重要進(jìn)展是HNR(Lookahead Exploration with Neural Radiance Representation),這是第一個(gè)可用于視覺(jué)語(yǔ)言導(dǎo)航的可泛化特征場(chǎng)。HNR通過(guò)將歷史觀察的視覺(jué)特征映射到三維空間,并利用體積渲染解碼與CLIP語(yǔ)義空間對(duì)齊的新視角表征,顯著提高了智能體的導(dǎo)航規(guī)劃能力。相關(guān)成果在CVPR 2024 Highlight中得到展示。

        4. 視覺(jué)語(yǔ)言導(dǎo)航的Sim-to-Real部署

        面對(duì)現(xiàn)實(shí)環(huán)境中機(jī)器人僅配備單目相機(jī)的挑戰(zhàn),VLN-3DFF提出了一種新的Sim-to-Real方案,該方案通過(guò)3D特征場(chǎng)構(gòu)建高性能的單目視覺(jué)語(yǔ)言導(dǎo)航模型。該模型能夠通過(guò)語(yǔ)義地圖預(yù)測(cè)全景范圍的可導(dǎo)航候選點(diǎn),成功率提升超過(guò)6%。相關(guān)論文將在CoRL 2024中發(fā)表。

        5. 利用3D語(yǔ)言數(shù)據(jù)訓(xùn)練層次化特征場(chǎng)提升機(jī)器人導(dǎo)航能力

        3D-LF是一個(gè)重要的研究成果,它通過(guò)大規(guī)模3D-Language數(shù)據(jù)訓(xùn)練層次化特征場(chǎng),實(shí)現(xiàn)了對(duì)物體、關(guān)系和環(huán)境布局的多層級(jí)語(yǔ)義表征。這項(xiàng)研究不僅提升了視覺(jué)語(yǔ)言導(dǎo)航的性能,也驗(yàn)證了3D語(yǔ)言特征場(chǎng)在具身任務(wù)中的應(yīng)用價(jià)值。

        綜上所述,具身導(dǎo)航領(lǐng)域的研究進(jìn)展為智能體的自主導(dǎo)航能力提供了新的方法和思路,尤其是在三維環(huán)境的理解和表征方面。未來(lái)的研究將繼續(xù)探索如何將這些技術(shù)有效應(yīng)用于真實(shí)世界的場(chǎng)景中,以推動(dòng)具身智能的實(shí)際應(yīng)用。


        聯(lián)系作者

        文章來(lái)源:智猩猩GenAI
        作者微信:
        作者簡(jiǎn)介:智猩猩旗下矩陣賬號(hào)之一,聚焦大模型開(kāi)啟的通用人工智能浪潮。

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 337p日本欧洲亚洲大胆色噜噜| 中文字幕亚洲综合小综合在线| 曰韩亚洲av人人夜夜澡人人爽| 久久久久亚洲AV无码永不| 亚洲人成人伊人成综合网无码| a级黄色毛片免费播放视频| 女性自慰aⅴ片高清免费| 国产亚洲av片在线观看16女人 | 亚洲国产精品免费观看| 中国一级特黄的片子免费| 麻豆精品国产免费观看| 亚洲天天做日日做天天看 | 亚洲精品自产拍在线观看| 国产在线观看免费av站| 国产亚洲欧洲精品| 最近中文字幕免费mv在线视频| 国产成人高清精品免费软件| 亚洲福利一区二区精品秒拍| 成人国产网站v片免费观看| 最近2019中文字幕mv免费看| 亚洲人成电影在线天堂| 久视频精品免费观看99| 国外亚洲成AV人片在线观看| 免费看无码特级毛片| 亚洲国产成人久久综合野外| 亚洲精品国产日韩| 免费少妇a级毛片| 色噜噜噜噜亚洲第一| 午夜视频免费成人| j8又粗又长又硬又爽免费视频 | 亚洲国产另类久久久精品黑人| 日本免费人成网ww555在线| 青青草原亚洲视频| 久久国产免费一区二区三区| 亚洲福利视频网址| 亚洲欧洲国产成人综合在线观看| 国产综合激情在线亚洲第一页| 免费做爰猛烈吃奶摸视频在线观看 | 亚洲熟伦熟女新五十路熟妇| 久久亚洲精品中文字幕| 亚洲va在线va天堂va不卡下载|