Noam Brown早已預(yù)示o1強(qiáng)大推理能力,演講深度解析AI推理研究脈絡(luò)
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Noam Brown早已預(yù)示o1強(qiáng)大推理能力,演講深度解析AI推理研究脈絡(luò)
關(guān)鍵字:模型,撲克,人類,方法,神經(jīng)網(wǎng)絡(luò)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:Panda不久之前,OpenAI 發(fā)布了 o1 系列模型,其強(qiáng)大的推理能力讓我們看見了 AI 發(fā)展的新可能。近日,OpenAI 著名研究科學(xué)家 Noam Brown 一份 5 月的演講上線網(wǎng)絡(luò),或可揭示 o1 背后的研究發(fā)展脈絡(luò)。
在這個(gè)題為「關(guān)于 AI 規(guī)劃力量的寓言:從撲克到」的演講中, Brown 介紹了撲克、圍棋和等游戲領(lǐng)域的研究突破,并尤其強(qiáng)調(diào)了搜索/規(guī)劃算法在這些成就中的關(guān)鍵作用。之后,他也指出了搜索/規(guī)劃研究在改進(jìn)機(jī)器學(xué)習(xí)模型方面的潛在未來。
Noam Brown,如果你還不熟悉這個(gè)名字:他是 OpenAI 的一位著名研究科學(xué)家,主攻方向是推理和自博弈,曾參與創(chuàng)造了首個(gè)在雙玩家和多玩家無限注德州撲克上擊敗人類頂級(jí)職業(yè)玩家的 AI:Libratus 和 Pluribus。其中 Pluribus 曾被 Science 評(píng)選為 2019 年十大科學(xué)突破之一。此外,他也領(lǐng)導(dǎo)開發(fā)了 Cicero 系統(tǒng),這是首個(gè)在自然語(yǔ)言策略游戲 Diplomacy 上達(dá)到人類水平的 AI。憑借在 AI 領(lǐng)域的卓越貢獻(xiàn),他獲得過馬文·明斯基獎(jiǎng)?wù)拢∕arvin Mins
原文鏈接:Noam Brown早已預(yù)示o1強(qiáng)大推理能力,演講深度解析AI推理研究脈絡(luò)
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: