原標題:強化學習之父Richard Sutton:AGI研究的下一個范式
文章來源:人工智能學家
內容字數:23996字
文章要點總結
隨著AI技術的發展,尤其是大型語言模型的崛起,研究者Richard Sutton對深度學習的現狀提出了批評。Sutton認為,當前的深度學習主要依賴瞬態學習,缺乏持續學習的能力,這使得AI在面對復雜環境時的適應性不足。
1. 強化學習的早期靈感
Sutton從上世紀70年代就對強化學習產生了興趣,認為與外界互動并從中學習是智能的核心。他指出,許多早期AI研究忽視了建立目標的重要性,偏重于模式識別。
2. 線性與非線性的兩難選擇
在強化學習中,Sutton強調需要建立世界模型,并在多個時間尺度上進行學習。當前的非線性學習雖然取得了一定成功,但往往犧牲了持續學習的能力。
3. 深度學習做的是瞬態學習
他認為,深度學習主要實現的是瞬態學習,即在特定階段后不再學習,缺乏對新信息的適應能力。
4. 持續學習的重要性
Sutton呼吁研究者關注如何實現持續學習,認為這對于構建智能系統至關重要。他希望能夠在保持非線性學習的同時,實現持續學習的能力。
5. 單一目標就是獲得獎勵
他提出,所有目標追求都可以理解為對單一外部獎勵信號的最大化,強調理解大腦如何通過試錯學習來實現目標的重要性。
6. 關于智能的預測
Sutton對未來的預測是,到2030年我們可能對智能有更深入的理解,技術將會發生顯著變革,這將改變我們對自身與AI的認知。
7. 對研究者的建議
Sutton建議研究者保持寫作習慣,記錄自己的想法,并對當前的流行趨勢保持中立,選擇有意義的問題進行研究。
總之,Richard Sutton對AI領域的未來充滿期待,但同時也指出了當前深度學習的局限性,呼吁更深入的研究以推動智能系統的持續學習能力。
聯系作者
文章來源:人工智能學家
作者微信:
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...