
AIGC動態歡迎閱讀
原標題:世界模型也擴散!訓練出的智能體竟然不錯
關鍵字:模型,人工智能,智能,世界,標桿
文章來源:機器之心
內容字數:4291字
內容摘要:
機器之心報道
編輯:小舟、陳萍在圖像生成領域占據主導地位的擴散模型,開始挑戰強化學習智能體。世界模型提供了一種以安全且樣本高效的方式訓練強化學習智能體的方法。近期,世界模型主要對離散潛在變量序列進行操作來模擬環境動態。
然而,這種壓縮為緊湊離散表征的方式可能會忽略對強化學習很重要的視覺細節。另一方面,擴散模型已成為圖像生成的主要方法,對離散潛在模型提出了挑戰。
受這種范式轉變的推動,來自日內瓦大學、愛丁堡大學、微軟研究院的研究者聯合提出一種在擴散世界模型中訓練的強化學習智能體 —— DIAMOND(DIffusion As a Model Of eNvironment Dreams)。論文地址:https://arxiv.org/abs/2405.12399
項目地址:https://github.com/eloialonso/diamond
論文標題:Diffusion for World Modeling: Visual Details Matter in Atari
DIAMOND 在 Atari 100k 基準測試中獲得了 1.46 的平均人類歸一化得分 (HNS),可以媲美完
原文鏈接:世界模型也擴散!訓練出的智能體竟然不錯
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號