AIGC動態歡迎閱讀
原標題:TPAMI | 安全強化學習方法、理論與應用綜述,慕工大、同濟、伯克利等深度解析
關鍵字:環境,算法,智能,策略,基準
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本篇綜述工作已被《IEEE 模式分析與機器智能匯刊》(IEEE TPAMI)接收,論文第一作者顧尚定博士來自慕尼黑工業大學、加州大學伯克利分校,論文通訊作者陳廣教授來自同濟大學計算機科學與技術學院。共同作者包括北京大學楊龍博士、倫敦大學杜雅麗教授、倫敦大學學院汪軍教授、慕尼黑工業大學 Florian Walter 和 Alois Knoll 教授。
隨著人工智能(AI)的飛速發展,強化學習(Reinforcement Learning,RL)在諸多復雜決策任務中取得了顯著的成功。我們在自動駕駛、機器人控制和推薦系統等實際應用中,越來越依賴于這些智能系統。然而,現實世界中的強化學習在應用過程中也面臨著巨大的挑戰,尤其是如何保證系統的安全性。為了解決這一問題,
原文鏈接:TPAMI | 安全強化學習方法、理論與應用綜述,慕工大、同濟、伯克利等深度解析
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...