AIGC動態歡迎閱讀
原標題:張俊林:OpenAI o1的價值意義及強化學習的Scaling Law
關鍵字:模型,能力,邏輯推理,數據,方向
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心轉載
作者:新浪新技術研發負責人張俊林蹭下熱度談談 OpenAI o1 的價值意義及 RL 的 Scaling law。
一、OpenAI o1 是大模型的巨大進步
我覺得 OpenAI o1 是自 GPT 4 發布以來,基座大模型最大的進展,邏輯推理能力提升的效果和方法比預想的要好,GPT 4o 和 o1 是發展大模型不同的方向,但是 o1 這個方向更根本,重要性也比 GPT 4o 這種方向要重要得多,原因下面會分析。
為什么說 o1 比 4o 方向重要?
這是兩種不同的大模型發展思路,說實話在看到 GPT 4o 發布的時候我是有些失望的,我當時以為 OpenAI 會優先做 o1 這種方向,但是沒想到先出了 GPT 4o。GPT 4o 本質上是要探索不同模態相互融合的大一統模型應該怎么做的問題,對于提升大模型的智力水平估計幫助不大;而 o1 本質上是在探索大模型在 AGI 路上能走多遠、天花板在哪里的問題,很明顯第二個問題更重要。
GPT 4o 的問題在于本身大模型的智力水平還不夠高,所以做不了復雜任務,導致很多應用場景無法實用化,而指望靠圖片、視頻這類新模態數據大幅提升大模
原文鏈接:張俊林:OpenAI o1的價值意義及強化學習的Scaling Law
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...