o1誕生對下一輪AI爆發(fā)的啟示:技術(shù)遠(yuǎn)遠(yuǎn)沒有收斂,仍在演進(jìn)丨智源Workshop精華觀點回顧
AIGC動態(tài)歡迎閱讀
原標(biāo)題:o1誕生對下一輪AI爆發(fā)的啟示:技術(shù)遠(yuǎn)遠(yuǎn)沒有收斂,仍在演進(jìn)丨智源Workshop精華觀點回顧
關(guān)鍵字:模型,能力,世界,問題,人工智能
文章來源:人工智能學(xué)家
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
來源:智源社區(qū)
上月,智源社區(qū)組織了「智源Workshop:從o1出發(fā),探索LLM推理與思維鏈」線上研討會,邀請到多位一線模型研究者參會分享討論(回放鏈接:https://event.baai.ac.cn/live/841)。精華觀點如下:
Q1:近期,OpenAI 發(fā)布了 o1 模型,標(biāo)志著 AI 在處理高度復(fù)雜問題上又邁出了重要一步。根據(jù)官方介紹,這些模型在推理數(shù)學(xué)技能、投資者分析期權(quán)交易策略等特殊任務(wù)上表現(xiàn)出色。官方表示,o1 的核心技術(shù)是強化學(xué)習(xí)和私密思維鏈。請各位專家首先談?wù)剬?o1 發(fā)布的看法,以及它對個人研究方向或工作的潛在影響。
安波:OpenAI o1 近期引爆了學(xué)術(shù)界和工業(yè)界的討論熱情,各種關(guān)于 o1 的猜想層出不窮。實際上 OpenAI 發(fā)布的關(guān)于 o1 的博客文章比較短,我認(rèn)為有些猜想可能與真實情況差距比較遠(yuǎn)。
該模型的推理與之前先構(gòu)建大模型,然后用 SFT、RLHF 這些技術(shù)微調(diào)不一樣。這些技術(shù)是在推理完成后,再再產(chǎn)生答案時進(jìn)行額外的處理,從規(guī)劃的角度看怎樣的答案更好。我們在 NTU 的研究組針對 OpenAI 秘密開展的 Q* 項目,發(fā)表了全球第一篇相關(guān)的分
原文鏈接:o1誕生對下一輪AI爆發(fā)的啟示:技術(shù)遠(yuǎn)遠(yuǎn)沒有收斂,仍在演進(jìn)丨智源Workshop精華觀點回顧
聯(lián)系作者
文章來源:人工智能學(xué)家
作者微信:
作者簡介: