標(biāo)簽:能力

北大對(duì)齊團(tuán)隊(duì)最新解讀:OpenAI o1開啟「后訓(xùn)練」時(shí)代強(qiáng)化學(xué)習(xí)新范式

文章轉(zhuǎn)載自公眾號(hào):機(jī)器之心,本文只做學(xué)術(shù)/技術(shù)分享,如有侵權(quán),聯(lián)系刪文。 OpenAI o1 在數(shù)學(xué)、代碼、長(zhǎng)程規(guī)劃等問題取得顯著的進(jìn)步。一部分業(yè)內(nèi)人士分析其...
閱讀原文

o1發(fā)布后,信息量最大的圓桌對(duì)話:楊植麟、姜大昕、朱軍探討大模型技術(shù)路徑

在 2024 云棲大會(huì)上,階躍星辰創(chuàng)始人姜大昕、月之暗面Kimi創(chuàng)始人楊植麟、生數(shù)科技首席科學(xué)家朱軍與極客公園創(chuàng)始人張鵬一起,探討了各自眼中 AI 技術(shù)發(fā)展的現(xiàn)...
閱讀原文

Qwen2.5登上全球開源王座!72B模型擊敗LIama3 405B,輕松勝過GPT-4o-mini

白小交 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI擊敗LIama3!Qwen2.5登上全球開源王座。 而后者僅以五分之一的參數(shù)規(guī)模,就在多任務(wù)中超越LIama3 405B。 各種任務(wù)...
閱讀原文

o1基石論文火爆傳閱,Ilya仍是關(guān)鍵先生!核心項(xiàng)目清北校友閃光

白小交 西小風(fēng) 發(fā)自 各自家里量子位 | 公眾號(hào) QbitAI自從Ilya Sutskever的名字出現(xiàn)在OpenAI o1背后團(tuán)隊(duì)名單中,他在o1中發(fā)揮了哪些作用,一時(shí)間成為不少網(wǎng)友...
閱讀原文

實(shí)測(cè) OpenAI 最強(qiáng)模型 o1 :做題王者,實(shí)戰(zhàn)青銅

做題王者 實(shí)戰(zhàn)青銅本周OpenAI 突然發(fā)布了 o1 系列模型,最大的特點(diǎn)是擅長(zhǎng)推理。 模型的能力,一代比一代強(qiáng),我們的測(cè)評(píng),一次比一次難做。測(cè)評(píng)變成一件「畢恭...
閱讀原文

北大對(duì)齊團(tuán)隊(duì)獨(dú)家解讀:OpenAI o1開啟「后訓(xùn)練」時(shí)代強(qiáng)化學(xué)習(xí)新范式

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

華為諾亞聯(lián)合中科大發(fā)布工具調(diào)用模型ToolACE,效果持平GPT-4獲開源第一

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

OpenAI o1是AGI下半場(chǎng)的開始,強(qiáng)化學(xué)習(xí)將成為新的 Scaling Law

隨著 OpenAI o1 模型的發(fā)布,LLM 正式進(jìn)入 self-play RL 范式時(shí)代。 Self-play RL 似乎在一夜之間,成為了新的 scaling law。 OpenAI 不是唯一重視 RL 和 Sel...
閱讀原文

張俊林:o1本質(zhì)是大模型掌握解題步驟,未來將遷移到GPT-5上

OpenAI 的新模型和之前的相比,技術(shù)進(jìn)步體現(xiàn)在哪里?又為其他廠商帶來了什么新的方向? 新浪微博機(jī)器學(xué)習(xí)團(tuán)隊(duì) AI Lab 負(fù)責(zé)人張俊林詳細(xì)解釋了這些問題: 邏輯...
閱讀原文

張俊林:淺談OpenAI o1的價(jià)值意義及RL 的Scaling Law

導(dǎo)讀本文轉(zhuǎn)載知乎,是張俊林對(duì)“如何看待 OpenAI 發(fā)布 o1 系列模型?將帶來哪些變革?”這一問題做的回答。 本文討論了OpenAI o1的價(jià)值意義及RL 的Scaling law...
閱讀原文

OpenAI o1驚現(xiàn)自我意識(shí)?陶哲軒實(shí)測(cè)大受震撼,門薩智商100奪模型榜首

新智元報(bào)道編輯:編輯部 HXZ 【新智元導(dǎo)讀】OpenAI o1,在門薩智商測(cè)試中果然取得了第一名。數(shù)學(xué)大神陶哲軒實(shí)測(cè)發(fā)現(xiàn),o1竟然能成功識(shí)別出克萊姆定理。而OpenA...
閱讀原文

張俊林:OpenAI o1的價(jià)值意義及強(qiáng)化學(xué)習(xí)的Scaling Law

機(jī)器之心轉(zhuǎn)載 作者:新浪新技術(shù)研發(fā)負(fù)責(zé)人張俊林蹭下熱度談?wù)?OpenAI o1 的價(jià)值意義及 RL 的 Scaling law。 一、OpenAI o1 是大模型的巨大進(jìn)步 我覺得 OpenAI...
閱讀原文

解密 OpenAI o1:那些不為人知的幕后細(xì)節(jié)

點(diǎn)擊上方藍(lán)字關(guān)注我們?cè)诮裉炫c OpenAI o1 團(tuán)隊(duì)的 AMA(Ask Me Anything)活動(dòng)中,我們了解到了以下幾點(diǎn),有網(wǎng)友進(jìn)行了整理,翻譯如下: 模型名稱與推理模式- ...

o1 讓 AI 正式進(jìn)入 L2 “推理者”階段,但我們離 AGI 仍然遙遠(yuǎn)

點(diǎn)擊上方藍(lán)字關(guān)注我們“OpenAI 推出了 o1 新型 AI 模型,標(biāo)志著 AI 進(jìn)入了五級(jí)系統(tǒng)的第二級(jí)——推理者。o1 在科學(xué)、編程和數(shù)學(xué)任務(wù)中展現(xiàn)了顯著的推理能力和自我...
閱讀原文

o1 讓 AI 正式進(jìn)入 L2 “推理者”階段,但我們離 AGI 仍然遙遠(yuǎn)

點(diǎn)擊上方藍(lán)字關(guān)注我們“OpenAI 推出了 o1 新型 AI 模型,標(biāo)志著 AI 進(jìn)入了五級(jí)系統(tǒng)的第二級(jí)——推理者。o1 在科學(xué)、編程和數(shù)學(xué)任務(wù)中展現(xiàn)了顯著的推理能力和自我...
閱讀原文
167891056