AIGC動態歡迎閱讀
原標題:Yann LeCun不看好強化學習:「我確實更喜歡 MPC」
關鍵字:模型,機器,智能,系統,機器人
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:張倩、小舟五十多年前的理論還值得再研究一下?「相比于強化學習(RL),我確實更喜歡模型預測控制(MPC)。至少從 2016 年起,我就一直在強調這一點。強化學習在學習任何新任務時都需要進行極其大量的嘗試。相比之下,模型預測控制是零樣本的:如果你有一個良好的世界模型和一個良好的任務目標,模型預測控制就可以在不需要任何特定任務學習的情況下解決新任務。這就是規劃的魔力。這并不意味著強化學習是無用的,但它的使用應該是最后的手段。」
在最近發布的一個帖子中,Meta 首席人工智能科學家 Yann LeCun 發表了這樣一番看法。一直以來,Yann LeCun 都是強化學習的批評者。他認為,強化學習這種方法需要大量的試驗,非常低效。這和人類的學習方式大相徑庭 —— 嬰兒不是通過觀察一百萬個相同物體的樣本來識別物體,或者嘗試危險的東西并從中學習,而是通過觀察、預測和與它們互動,即使沒有監督。
在半年前的一次演講中,他甚至主張「放棄強化學習」(參見《GPT-4 的研究路徑沒有前途?Yann LeCun 給自回歸判了》)。但在隨后的一次采訪中,他又解釋說,他的意思并不是完全放棄,
原文鏈接:Yann LeCun不看好強化學習:「我確實更喜歡 MPC」
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...