標簽:能力
北大對齊團隊最新解讀:OpenAI o1開啟「后訓練」時代強化學習新范式
文章轉載自公眾號:機器之心,本文只做學術/技術分享,如有侵權,聯系刪文。 OpenAI o1 在數學、代碼、長程規劃等問題取得顯著的進步。一部分業內人士分析其...
o1發布后,信息量最大的圓桌對話:楊植麟、姜大昕、朱軍探討大模型技術路徑
在 2024 云棲大會上,階躍星辰創始人姜大昕、月之暗面Kimi創始人楊植麟、生數科技首席科學家朱軍與極客公園創始人張鵬一起,探討了各自眼中 AI 技術發展的現...
Qwen2.5登上全球開源王座!72B模型擊敗LIama3 405B,輕松勝過GPT-4o-mini
白小交 發自 凹非寺量子位 | 公眾號 QbitAI擊敗LIama3!Qwen2.5登上全球開源王座。 而后者僅以五分之一的參數規模,就在多任務中超越LIama3 405B。 各種任務...
o1基石論文火爆傳閱,Ilya仍是關鍵先生!核心項目清北校友閃光
白小交 西小風 發自 各自家里量子位 | 公眾號 QbitAI自從Ilya Sutskever的名字出現在OpenAI o1背后團隊名單中,他在o1中發揮了哪些作用,一時間成為不少網友...
實測 OpenAI 最強模型 o1 :做題王者,實戰青銅
做題王者 實戰青銅本周OpenAI 突然發布了 o1 系列模型,最大的特點是擅長推理。 模型的能力,一代比一代強,我們的測評,一次比一次難做。測評變成一件「畢恭...
北大對齊團隊獨家解讀:OpenAI o1開啟「后訓練」時代強化學習新范式
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
華為諾亞聯合中科大發布工具調用模型ToolACE,效果持平GPT-4獲開源第一
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
OpenAI o1是AGI下半場的開始,強化學習將成為新的 Scaling Law
隨著 OpenAI o1 模型的發布,LLM 正式進入 self-play RL 范式時代。 Self-play RL 似乎在一夜之間,成為了新的 scaling law。 OpenAI 不是唯一重視 RL 和 Sel...
張俊林:o1本質是大模型掌握解題步驟,未來將遷移到GPT-5上
OpenAI 的新模型和之前的相比,技術進步體現在哪里?又為其他廠商帶來了什么新的方向? 新浪微博機器學習團隊 AI Lab 負責人張俊林詳細解釋了這些問題: 邏輯...
張俊林:淺談OpenAI o1的價值意義及RL 的Scaling Law
導讀本文轉載知乎,是張俊林對“如何看待 OpenAI 發布 o1 系列模型?將帶來哪些變革?”這一問題做的回答。 本文討論了OpenAI o1的價值意義及RL 的Scaling law...
OpenAI o1驚現自我意識?陶哲軒實測大受震撼,門薩智商100奪模型榜首
新智元報道編輯:編輯部 HXZ 【新智元導讀】OpenAI o1,在門薩智商測試中果然取得了第一名。數學大神陶哲軒實測發現,o1竟然能成功識別出克萊姆定理。而OpenA...
張俊林:OpenAI o1的價值意義及強化學習的Scaling Law
機器之心轉載 作者:新浪新技術研發負責人張俊林蹭下熱度談談 OpenAI o1 的價值意義及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大進步 我覺得 OpenAI...
解密 OpenAI o1:那些不為人知的幕后細節
點擊上方藍字關注我們在今天與 OpenAI o1 團隊的 AMA(Ask Me Anything)活動中,我們了解到了以下幾點,有網友進行了整理,翻譯如下: 模型名稱與推理模式- ...
o1 讓 AI 正式進入 L2 “推理者”階段,但我們離 AGI 仍然遙遠
點擊上方藍字關注我們“OpenAI 推出了 o1 新型 AI 模型,標志著 AI 進入了五級系統的第二級——推理者。o1 在科學、編程和數學任務中展現了顯著的推理能力和自我...
o1 讓 AI 正式進入 L2 “推理者”階段,但我們離 AGI 仍然遙遠
點擊上方藍字關注我們“OpenAI 推出了 o1 新型 AI 模型,標志著 AI 進入了五級系統的第二級——推理者。o1 在科學、編程和數學任務中展現了顯著的推理能力和自我...
粵公網安備 44011502001135號