<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        率先突破大規模多類數據損壞問題!中科大離線強化學習新方式入選NeurIPS 2024

        AIGC動態7個月前發布 量子位
        504 0 0

        率先突破大規模多類數據損壞問題!中科大離線強化學習新方式入選NeurIPS 2024

        AIGC動態歡迎閱讀

        原標題:率先突破大規模多類數據損壞問題!中科大離線強化學習新方式入選NeurIPS 2024
        關鍵字:數據,離線,動作,函數,不確定性
        文章來源:量子位
        內容字數:0字

        內容摘要:


        中科大楊睿 投稿量子位 | 公眾號 QbitAI機器人控制和自動駕駛的離線數據損壞問題有解了!
        中科大王杰教授團隊 (MIRA Lab) 提出了一種變分貝葉斯推斷方法,有效地提升了智能決策模型的魯棒性。
        論文發表在CCF-A類人工智能頂級會議NeurIPS 2024。
        現實世界的離線數據集(如機器人控制、自動駕駛等)常常因傳感器故障或惡意攻擊而受到數據損壞(如數據帶有噪聲或對抗性攻擊)的影響。
        盡管現有離線強化學習(offline RL)方法在魯棒性方面已取得了進展,但它們仍難以處理因離線數據的各類元素(即狀態、動作、獎勵和轉移動態)均部分損壞所引入的高不確定性。
        作者針對離線數據的各類元素均有受損這一復雜的實際問題,提出了一種魯棒的變分貝葉斯推斷方法TRACER。
        在面臨各類數據損壞時,該方法于所有實驗中均實現了最優,相對于現有的SOTA方法提升了高達+21.1%的決策性能,并在24組僅有單類數據損壞的實驗中仍實現了16組的最優性能。
        TRACER主要具有以下三點優勢:
        TRACER首次將貝葉斯推斷引入到抗損壞的離線強化學習(corruption-robust offline RL)


        原文鏈接:率先突破大規模多類數據損壞問題!中科大離線強化學習新方式入選NeurIPS 2024

        聯系作者

        文章來源:量子位
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 成全动漫视频在线观看免费高清版下载 | 最近最好最新2019中文字幕免费| 日本亚洲国产一区二区三区| 一级特黄录像视频免费| 中文字幕亚洲不卡在线亚瑟| 成人自慰女黄网站免费大全| 久久久久亚洲精品成人网小说 | 免费观看成人毛片a片2008| 亚洲国产av高清无码| 亚洲一区在线免费观看| 在线视频观看免费视频18| 亚洲自国产拍揄拍| 日韩免费观看视频| 人人公开免费超级碰碰碰视频 | 最近中文字幕mv免费高清在线 | gogo全球高清大胆亚洲| 国产黄在线播放免费观看| 亚洲AV无码专区国产乱码电影| 91香蕉成人免费网站| 亚洲国产午夜精品理论片在线播放| 国产三级电影免费观看| 999zyz**站免费毛片| 亚洲老熟女@TubeumTV| 免费看的黄色大片| 国产精品玖玖美女张开腿让男人桶爽免费看| 亚洲欧洲日产国码无码久久99| 91福利视频免费观看| 亚洲精品蜜夜内射| 浮力影院亚洲国产第一页| 最近免费中文字幕高清大全| 蜜芽亚洲av无码一区二区三区| 在线A亚洲老鸭窝天堂| 69av免费视频| 一区二区三区在线免费 | 久久精品国产亚洲AV无码麻豆| 日韩视频在线免费| 国产免费一区二区三区在线观看| 亚洲首页国产精品丝袜| 国产亚洲精品a在线观看| 我们的2018在线观看免费高清| 成人免费网站视频www|