AIGC動態歡迎閱讀
原標題:Karpathy后悔了:2015年就看到了語言模型的潛力,卻搞了多年強化學習
關鍵字:字符,解讀,模型,序列,神經網絡
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部耽誤業界好多年?「這是有史以來最大、最令人困惑的研究生涯錯誤,」Andrej Karpathy 感嘆道。
上個周末,OpenAI 創始成員、研究科學家、原特斯拉前 AI 高級總監、AI 領域的大神 Andrej Karpathy 一直在后悔。后悔自己沒有早點帶領 OpenAI 開創大模型時代。是怎么一回事?看起來 Karpathy 認為當年早已認識到自回歸語言模型的強大潛力,但卻在很長一段時間里「誤入歧途」,隨大溜一起搞強化學習。2013 年的 Atari RL 論文被認為是深度強化學習的開山之作:一個通用學習算法就發現了 Breakout 和許多其他游戲的最佳策略,看起來,在很多任務上我們只需要對其進行足夠的改進和擴展,就可以構建出強大的 AI 模型了。我們也還記得,在 Karpathy 跳槽去到特斯拉一年后,2018 年 OpenAI 推出了 OpenAI Five,利用強化學習的方法在 Dota 2 游戲上開始與職業選手過招。
在 2019 年,OpenAI 的研究者還訓練神經網絡,利用一只類人機械手來玩魔方,表明強化學習工具不僅僅可以處理虛擬任務,而
原文鏈接:Karpathy后悔了:2015年就看到了語言模型的潛力,卻搞了多年強化學習
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...