国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片

NeurIPS Spotlight | 基于信息論,決策模型有了全新預訓練范式統一框架

AIGC動態9個月前發布 機器之心
534 0 0

為離線元強化學習提供統一理論基礎和算法設計準則。

NeurIPS Spotlight | 基于信息論,決策模型有了全新預訓練范式統一框架

原標題:NeurIPS Spotlight | 基于信息論,決策模型有了全新預訓練范式統一框架
文章來源:機器之心
內容字數:7426字

之江實驗室、香港中文大學等團隊提出離線元強化學習新算法UNICORN

本文總結了機器之心AIxiv專欄報道的關于離線元強化學習(Offline Meta-RL)新算法UNICORN的研究成果。該算法由之江實驗室、香港中文大學、同濟大學等單位的研究團隊共同提出,并被NeurIPS 2024接收為Spotlight文章。

1. 背景:離線元強化學習的挑戰

經典強化學習依賴于智能體與環境的在線交互,但在高風險場景(如自動駕駛、藥物發現)中不可行。離線強化學習(Offline RL)利用歷史數據進行學習,避免了在線交互的風險,但其泛化能力有限。元強化學習(Meta-RL)則注重多任務學習和遷移學習,具有強大的泛化能力。結合兩者優勢的“基于語境的離線元強化學習”(COMRL)應運而生,其核心在于學習魯棒有效的任務表征,以應對“語境偏移”問題——訓練數據與測試任務分布差異巨大。

2. UNICORN:基于信息論的統一框架

現有COMRL方法主要依靠經驗性改進損失函數,缺乏理論支撐。UNICORN算法的創新之處在于,它首次基于信息論,系統性地構建了COMRL中任務表示學習的理論框架。該框架從數學定義、因果關系分解、中心定理三個層面,對任務表示學習進行了嚴格的理論推導和分析。

具體而言:

  1. 數學定義:將任務表示學習定義為尋找數據相對于任務變量的充分統計量。
  2. 因果關系分解:將數據樣本的因果關系分解為主因果關系(與任務相關)和次因果關系(與行為策略相關),并對應到互信息的分解。
  3. 中心定理:證明了一個關于互信息的不等式,指出最優優化目標應該介于主因果關系和主次因果關系之和之間,并提出互信息 I(Z;M) 作為任務表示學習的金標準。

基于此理論框架,UNICORN提出了兩種算法實現:有監督UNICORN和自監督UNICORN,分別將I(Z;M)的求解近似為分類問題和數據重建+度量學習。

3. 實驗結果:UNICORN的優勢

實驗結果表明,UNICORN算法在多種機器人連續控制任務中表現出色:

  • 在同分布和分布外測試集上均取得了優異的性能,尤其在分布外測試集上顯著優于現有方法。
  • 在不同質量的數據集上表現穩定,達到了最先進水平。
  • 具有良好的模型架構可遷移性,可作為即插即用模塊應用于其他RL算法。
  • 在分布外任務上實現了正向小樣本遷移,展現了強大的泛化能力。

4. 未來展望

UNICORN為離線元強化學習提供了統一的理論基礎和算法設計準則,對決策大模型的離線多任務預訓練和微調具有重要指導意義,有望推動藥物設計、精準醫療等領域的AI發展。


聯系作者

文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺

閱讀原文
? 版權聲明
蟬鏡AI數字人

相關文章

蟬鏡AI數字人

暫無評論

暫無評論...
国产精品亚洲mnbav网站_成人午夜亚洲精品无码网站_日韩va亚洲va欧洲va国产_亚洲欧洲精品成人久久曰影片
<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        精品国产乱码久久久久久浪潮| 久久国产精品第一页| 亚洲免费毛片网站| 99国产精品99久久久久久| 亚洲色图丝袜美腿| 欧美最新大片在线看| 婷婷夜色潮精品综合在线| 日韩欧美激情一区| 国产成人精品aa毛片| 亚洲色图一区二区三区| 欧美亚洲一区二区在线| 成人午夜在线视频| 亚洲国产精华液网站w| 色伊人久久综合中文字幕| 日韩成人一级片| 国产精品情趣视频| 精品视频免费在线| 国产东北露脸精品视频| 亚洲综合另类小说| 久久精品亚洲精品国产欧美kt∨| av色综合久久天堂av综合| 日韩激情在线观看| 国产精品传媒在线| 精品91自产拍在线观看一区| 色综合夜色一区| 狠狠v欧美v日韩v亚洲ⅴ| 日韩毛片在线免费观看| 精品少妇一区二区三区在线视频 | 午夜视频久久久久久| 日韩精品一区二区三区中文不卡 | 国产成人av在线影院| 亚洲一区二区三区四区在线| 久久一区二区三区国产精品| 欧美探花视频资源| 成人免费视频播放| 精品一二三四在线| 午夜精品一区二区三区电影天堂| 中文字幕乱码一区二区免费| 精品久久久久香蕉网| 欧美日韩色综合| 91免费版pro下载短视频| 国产精品12区| 久久精品国产精品青草| 亚洲五码中文字幕| 亚洲乱码国产乱码精品精可以看| 欧美激情一区二区三区在线| 日韩免费视频一区二区| 欧美日韩久久久一区| 91麻豆国产自产在线观看| 成人妖精视频yjsp地址| 国产乱码精品一区二区三| 另类综合日韩欧美亚洲| 日韩国产一二三区| 日日骚欧美日韩| 日韩高清在线不卡| 亚洲精品v日韩精品| 久久久不卡影院| 亚洲乱码国产乱码精品精小说| 欧美久久久一区| av在线不卡网| 色婷婷久久一区二区三区麻豆| 免费观看在线色综合| 亚洲一区在线电影| 一区二区三区蜜桃网| 日韩国产欧美三级| 视频在线观看一区| 日韩一区二区在线观看视频播放| 在线不卡一区二区| 337p亚洲精品色噜噜狠狠| 欧美日韩午夜影院| 欧美日韩激情一区二区三区| 欧美亚洲一区二区在线| 欧美在线|欧美| 欧美夫妻性生活| 精品久久久网站| 国产精品久久久久影院老司| 一区二区久久久久久| 日本中文字幕不卡| 国产综合久久久久影院| 成人免费不卡视频| 欧美另类一区二区三区| 精品日韩在线观看| 亚洲欧美日韩中文字幕一区二区三区| 亚洲一区二区欧美日韩| 免费在线观看精品| 国产不卡视频在线观看| 在线精品视频一区二区三四| 91精品国产免费久久综合| 日本一区二区三区高清不卡| 亚洲欧美日韩国产综合| 丝袜亚洲精品中文字幕一区| 国产乱子伦视频一区二区三区 | 一区二区免费看| 久久国产精品免费| 日本高清免费不卡视频| 日韩欧美电影一二三| 欧美激情一区在线| 日本怡春院一区二区| 粉嫩av一区二区三区在线播放 | 中文字幕亚洲欧美在线不卡| 亚洲123区在线观看| 国产福利视频一区二区三区| 欧美色图12p| 国产精品三级视频| 免费观看在线综合色| 色狠狠桃花综合| 久久久久国产精品厨房| 国产精品嫩草久久久久| 欧洲视频一区二区| av成人免费在线| 国产欧美一区二区三区沐欲| 成人激情午夜影院| 久草热8精品视频在线观看| 欧美日韩在线播| 国产精品99久久不卡二区| 亚洲视频一二三区| 亚洲精品一区二区三区影院| 色8久久人人97超碰香蕉987| 欧美另类z0zxhd电影| 91精品国产综合久久久久久| 亚洲精品日产精品乱码不卡| 国产精品一区在线| 日韩欧美综合一区| 日韩在线卡一卡二| 成人app下载| 国产成人精品免费一区二区| 国模无码大尺度一区二区三区| 久久亚洲影视婷婷| 欧美一三区三区四区免费在线看| 六月丁香婷婷色狠狠久久| 欧美日韩精品欧美日韩精品一 | 91成人在线免费观看| 亚洲精品一区二区精华| 青娱乐精品视频| 在线成人av影院| 香蕉久久一区二区不卡无毒影院| 91高清视频在线| 亚洲韩国精品一区| 欧美色图第一页| 三级在线观看一区二区| 欧美一级午夜免费电影| 国产精品不卡在线观看| 图片区小说区国产精品视频| 午夜在线成人av| 欧美国产激情二区三区| 国产成人精品www牛牛影视| 国产亚洲va综合人人澡精品| 国产91精品露脸国语对白| 久久一区二区视频| 成人国产电影网| 亚洲免费在线播放| 在线成人小视频| 精品在线播放午夜| 久久久蜜桃精品| 成人国产精品免费观看| 亚洲午夜羞羞片| 日韩精品一区二区三区视频| 国产一本一道久久香蕉| 秋霞成人午夜伦在线观看| 精品福利在线导航| 99精品国产99久久久久久白柏| 亚洲一区av在线| 精品国产a毛片| 91在线视频观看| 日韩avvvv在线播放| 国产色综合一区| 精品视频1区2区3区| 国内成人自拍视频| 亚洲欧美另类久久久精品2019| 在线91免费看| 成人99免费视频| 久久精品国产999大香线蕉| 国产精品免费丝袜| 5858s免费视频成人| 成人一区二区三区中文字幕| 视频在线观看一区| **欧美大码日韩| 久久这里只有精品视频网| 91精品福利在线| 国产精品1区2区| 午夜电影久久久| 亚洲婷婷国产精品电影人久久| 欧美成人精品1314www| 色婷婷久久久亚洲一区二区三区 | 国产乱子伦一区二区三区国色天香| **性色生活片久久毛片| 久久众筹精品私拍模特| 91.xcao| 91麻豆swag| av午夜精品一区二区三区| 激情久久五月天| 日韩不卡一区二区三区| 一区二区三区在线视频观看58 | 欧美在线观看视频一区二区| 国模大尺度一区二区三区| 婷婷综合久久一区二区三区| 亚洲一区二区三区中文字幕在线| 亚洲视频一二三区| 最新日韩在线视频| 亚洲女同一区二区|