<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Bengio參與,擴散模型+蒙特卡洛樹搜索實現System 2規劃

        AIGC動態3個月前發布 機器之心
        218 0 0

        深度思考新方向?

        Bengio參與,擴散模型+蒙特卡洛樹搜索實現System 2規劃

        原標題:Bengio參與,擴散模型+蒙特卡洛樹搜索實現System 2規劃
        文章來源:機器之心
        內容字數:4244字

        蒙特卡洛樹擴散 (MCTD): 結合擴散模型與MCTS的規劃新框架

        本文總結了機器之心報道中關于蒙特卡洛樹擴散 (MCTD) 的研究成果。該研究由Yoshua Bengio和Sungjin Ahn領導的團隊完成,旨在結合擴散模型的生成能力和蒙特卡洛樹搜索 (MCTS) 的自適應搜索能力,以提升基于擴散的規劃的效率和可擴展性。

        1. 擴散模型與MCTS的優勢與不足

        擴散模型能夠生成復雜的軌跡,無需依賴前向動力學模型,尤其適用于長周期或稀疏獎勵的規劃任務。然而,提升其規劃精度的額外計算成本利用效率低。MCTS具有強大的可擴展性,能夠隨著計算量的增加有效提升規劃準確度,但依賴前向模型,存在全局一致性問題,且在長遠規劃和大動作空間中計算需求巨大。

        2. MCTD框架:創新之處

        MCTD框架巧妙地結合了擴散模型和MCTS,主要有三項創新:

        1. 將去噪過程重構成基于樹的rollout過程: 這使得MCTD能夠在保持軌跡連貫性的同時實現半自回歸的因果規劃。

        2. 引入引導層級作為元動作: 實現了“探索”與“利用”的動態平衡,確保在擴散框架內實現自適應和可擴展的軌跡優化。

        3. 采用快速跳躍去噪機制: 無需成本高昂的前向模型rollout即可有效估計軌跡質量。

        MCTD將MCTS的四個步驟(選擇、擴展、模擬和反向傳播)整合到擴散過程中,有效地將結構化搜索與生成式建模結合。

        3. MCTD的兩種視角及算法過程

        MCTD可以從MCTS視角和擴散視角兩種角度理解。MCTS視角強調MCTD在部分去噪樹上的迭代搜索過程;擴散視角則關注在去噪深度和規劃范圍上的部分去噪過程。該框架統一了這兩種視角。

        文章中給出了MCTD的算法流程圖,詳細描述了其運作機制。

        4. 實驗結果與未來展望

        實驗結果表明,MCTD在Offline Goal-conditioned RL Benchmark (OGBench)上的多種任務中,例如迷宮導航和機器人操作任務中,顯著優于其他方法,展現了其卓越的可擴展性和高質量的解決方案。 文章提供了多個表格和圖表,展示了MCTD在不同任務上的優越性能。

        研究團隊表示,未來將探索自適應計算分配、基于學習的元動作選擇和獎勵塑造等方向,以進一步提升MCTD的性能,為更具可擴展性和靈活性的System 2規劃鋪平道路。


        聯系作者

        文章來源:機器之心
        作者微信:
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 丰满少妇作爱视频免费观看| 亚洲人成黄网在线观看| 久久久久免费看黄A片APP| 全部免费国产潢色一级| 亚洲无人区午夜福利码高清完整版| 亚洲精品无码久久久久久久 | 久草视频在线免费| 又爽又高潮的BB视频免费看| 亚洲一线产品二线产品| 一级毛片**不卡免费播| 亚洲中文字幕无码专区| 国产精品hd免费观看| 综合久久久久久中文字幕亚洲国产国产综合一区首 | 亚洲高清在线视频| 亚洲欧洲国产经精品香蕉网| 免费大片av手机看片| 亚洲综合久久夜AV | 国产午夜成人免费看片无遮挡| 亚洲AV无码码潮喷在线观看 | 免费人成视频在线| 美女羞羞喷液视频免费| 亚洲午夜未满十八勿入网站2| 成人无码WWW免费视频| 亚洲人成伊人成综合网久久| 日韩免费视频播放| 一本色道久久综合亚洲精品蜜桃冫| 在线精品免费视频无码的| 你懂的在线免费观看| 亚洲国产美女视频| 亚洲av日韩片在线观看| 亚洲高清不卡视频| 国产高清在线免费| 免费91最新地址永久入口| 欧洲亚洲国产清在高| 精品一区二区三区免费| 亚洲人成电影在线观看青青| 亚洲成av人片在线观看天堂无码| 免费黄网站在线观看| 亚洲AV综合永久无码精品天堂| 日韩激情无码免费毛片| 免费无码又爽又刺激网站直播|