<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        擴散模型版CS: GO!世界模型+強化學習:2小時訓練登頂Atari 100K

        AIGC動態(tài)9個月前發(fā)布 新智元
        565 0 0

        擴散模型版CS: GO!世界模型+強化學習:2小時訓練登頂Atari 100K

        AIGC動態(tài)歡迎閱讀

        原標題:擴散模型版CS: GO!世界模型+強化學習:2小時訓練登頂Atari 100K
        關(guān)鍵字:模型,智能,世界,環(huán)境,得分
        文章來源:新智元
        內(nèi)容字數(shù):0字

        內(nèi)容摘要:


        新智元報道編輯:LRS
        【新智元導讀】DIAMOND是一種新型的強化學習智能體,在一個由擴散模型構(gòu)建的虛擬世界中進行訓練,能夠以更高效率學習和掌握各種任務(wù)。在Atari 100k基準測試中,DIAMOND的平均得分超越了人類玩家,證明了其在模擬復雜環(huán)境中處理細節(jié)和進行決策的能力。環(huán)境生成模型(generative models of environments),也可以叫世界模型(world model),在「通用智能體規(guī)劃」和「推理環(huán)境」中的關(guān)鍵組成部分,相比傳統(tǒng)強化學習采樣效率更高。
        但世界模型主要操作一系列離散潛在變量(discrete latent variables)以模擬環(huán)境動態(tài),但這種壓縮緊湊的離散表征有可能會忽略那些在強化學習中很重要的視覺細節(jié)。
        日內(nèi)瓦大學、愛丁堡大學的研究人員提出了一個在擴散世界模型中訓練的強化學習智能體DIAMOND(DIffusion As a Model Of eNvironment Dreams),文中分析了使擴散模型適應(yīng)于世界建模(world modeling)所需的設(shè)計要素,并展示了如何通過改善視覺細節(jié)來提高智能體的性能。論文鏈接:htt


        原文鏈接:擴散模型版CS: GO!世界模型+強化學習:2小時訓練登頂Atari 100K

        聯(lián)系作者

        文章來源:新智元
        作者微信:
        作者簡介:

        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产又大又粗又硬又长免费| 精品无码国产污污污免费网站国产| 国产一级淫片免费播放电影| 亚洲福利秒拍一区二区| 最近中文字幕免费完整| 亚洲精品午夜视频| 日韩精品无码区免费专区| 7777久久亚洲中文字幕| 最好免费观看韩国+日本| 最新亚洲人成无码网站| 亚洲Av无码乱码在线播放| 一级全免费视频播放| 国产AV无码专区亚洲AV漫画| 国产一级在线免费观看| 亚洲精品高清视频| 在线a级毛片免费视频| 中日韩亚洲人成无码网站| 国产片免费福利片永久| www一区二区www免费| 亚洲国产综合专区在线电影| 国产精品视频免费观看| 亚洲精品精华液一区二区| 亚洲精品第一国产综合境外资源| 青青操免费在线视频| 亚洲妓女综合网99| 四虎影视永久免费观看地址| 男女一边摸一边做爽的免费视频| 亚洲AV人人澡人人爽人人夜夜| 国产精品永久免费10000| 日韩亚洲人成在线综合| 国产V亚洲V天堂无码| 免费影院未满十八勿进网站| 青草青草视频2免费观看| 国产亚洲婷婷香蕉久久精品| 巨波霸乳在线永久免费视频| 日韩亚洲综合精品国产| 亚洲黄色在线电影| 亚洲精品久久久www | 三年在线观看免费观看完整版中文 | 亚洲人成精品久久久久| 国产四虎免费精品视频|