<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        如何解決智能體探索和利用行為之間的平衡問(wèn)題?

        AIGC動(dòng)態(tài)7個(gè)月前發(fā)布 AI前線
        263 0 0

        如何解決智能體探索和利用行為之間的平衡問(wèn)題?

        AIGC動(dòng)態(tài)歡迎閱讀

        原標(biāo)題:如何解決智能體探索和利用行為之間的平衡問(wèn)題?
        關(guān)鍵字:狀態(tài),結(jié)構(gòu),動(dòng)作,作者,智能
        文章來(lái)源:AI前線
        內(nèi)容字?jǐn)?shù):0字

        內(nèi)容摘要:


        作者|曾祥華 北京航空航天大學(xué) 博士生
        本文介紹來(lái)自北京航空航天大學(xué)彭浩老師團(tuán)隊(duì)發(fā)表在 NeurlPS 2024 上的一篇文章“Effective Exploration Based on the Structural Information Principles”。為了解決當(dāng)前基于傳統(tǒng)信息論的探索方法由于忽略狀態(tài) – 動(dòng)作空間內(nèi)在結(jié)構(gòu)而導(dǎo)致效率低下的問(wèn)題,作者提出了一種基于結(jié)構(gòu)信息原理的探索框架,即 SI2E。SI2E 通過(guò)定義結(jié)構(gòu)互信息,提出一種新的狀態(tài)動(dòng)作表征原則,捕捉狀態(tài) – 動(dòng)作對(duì)之間的動(dòng)態(tài)關(guān)系,構(gòu)建最優(yōu)編碼樹(shù)。通過(guò)分析狀態(tài) – 動(dòng)作對(duì)之間的價(jià)值差異,定義策略條件結(jié)構(gòu)熵,構(gòu)造內(nèi)在獎(jiǎng)勵(lì)機(jī)制,實(shí)現(xiàn)對(duì)于狀態(tài) – 動(dòng)作空間更為有效的覆蓋。在 MiniGrid、MetaWorld 和 DeepMind Control Suite 等測(cè)試環(huán)境中,SI2E 在最終性能與采樣效率等方面的表現(xiàn)遙遙領(lǐng)先,最大提升幅度分別達(dá)到了 37.63% 和 60.25%。
        論文名稱:Effective Exploration Based on the Structural Information Princ


        原文鏈接:如何解決智能體探索和利用行為之間的平衡問(wèn)題?

        聯(lián)系作者

        文章來(lái)源:AI前線
        作者微信:
        作者簡(jiǎn)介:

        閱讀原文
        ? 版權(quán)聲明
        Trae官網(wǎng)

        相關(guān)文章

        Trae官網(wǎng)

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論...
        主站蜘蛛池模板: 国产亚洲真人做受在线观看| 手机看片久久国产免费| 亚洲色成人中文字幕网站| 在线观看的免费网站| 亚洲美女视频免费| 黄色a级免费网站| 国产成人免费全部网站| 亚洲Av综合色区无码专区桃色| 国产精品无码免费专区午夜| 亚洲精品天堂成人片?V在线播放| 高潮毛片无遮挡高清免费视频| 亚洲国产成人久久笫一页| 一区二区视频在线免费观看| 区三区激情福利综合中文字幕在线一区亚洲视频1 | a级毛片免费观看网站| 区三区激情福利综合中文字幕在线一区亚洲视频1 | 久久永久免费人妻精品| 亚洲毛片在线观看| 国产91色综合久久免费分享| 亚洲国产成人精品无码一区二区| 精品久久久久国产免费| 国产精品亚洲一区二区在线观看| 最好免费观看高清在线| 亚洲综合一区二区精品导航| 国产人成免费视频网站| 欧美日韩亚洲精品| 亚洲精品国自产拍在线观看| 91成人免费观看在线观看| 久久精品蜜芽亚洲国产AV| 手机在线看永久av片免费| 亚洲a无码综合a国产av中文| 亚洲色一色噜一噜噜噜| 久久这里只精品99re免费| 亚洲综合色婷婷在线观看| 亚洲免费观看网站| 亚洲精品亚洲人成在线| 亚洲色精品vr一区二区三区| 国产91免费视频| 一级做a爱过程免费视| 亚洲美女视频一区二区三区| 亚洲AV无码乱码在线观看牲色|