標簽:模型

連OpenAI都推不動Scaling Law了?MIT把「測試時訓練」系統研究了一遍,發現還有路

機器之心報道 機器之心編輯部昨天,The Information 的一篇文章讓 AI 社區炸了鍋。 這篇文章透露,OpenAI 下一代旗艦模型的質量提升幅度不及前兩款旗艦模型之...
閱讀原文

ByteDance Research登Nature子刊:AI+冷凍電鏡,揭示蛋白質動態

機器之心發布 機器之心編輯部2024 年的諾貝爾化學獎頒發給了在結構生物學領域取得重大成就的 David Baker 團隊和 AlphaFold 團隊,激發了 AI for science 領...
閱讀原文

完全開源的代碼大模型OpenCoder來了,躋身性能第一梯隊

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

伯克利羅劍嵐:機器人的范式,藏在真實世界中丨具身先鋒十人談

Sergey Levine 對羅劍嵐說,“You really made RL work.”作者丨賴文昕 編輯丨陳彩嫻 近日,伯克利大學 Sergey Levine 團隊發布了一項強化學習方向的重磅工作——...
閱讀原文

曝臺積電將停止向大陸供貨先進AI芯片;曠視創始人出任力帆科技董事長,曠視科創板IPO或將中止;月之暗面創始人被仲裁丨AI情報局

要聞提示1.臺積電被曝將應美國要求,從 11 月 11 日起停止向中國大陸供貨先進 AI 芯片 2.月之暗面創始人被前公司投資人提起仲裁,受理律師回應將提出抗辯 3....
閱讀原文

收集20+時空數據集,超1.3億樣本點,清華研究團隊基于生成式AI,提出3種城市復雜系統建模方法

作者:丁璟韜,李姝 編輯:李寶珠 在 HyperAI超神經聯合出品的 COSCon’24 AI for Science 論壇中,來自清華大學電子工程系城市科學與計算研究中心的博士后研...
閱讀原文

最強開源CodeLLM模型深夜來襲!320億參數,Qwen2.5-Coder新模型超越GPT-4o

小明 發自 凹非寺量子位 | 公眾號 QbitAI一夜之間,AI編程模型的開源王座易主了! Qwen2.5-Coder-32B正式發布,霸氣拿下多個主流基準測試SOTA,徹底登上全球...
閱讀原文

o1不是唯一路徑!MIT新研究:在測試時訓練,模型推理能力最高升至5.8倍

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIo1不是通向大模型推理的唯一路徑! MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。 在挑戰...
閱讀原文

開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版

VSA團隊 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。 港中文MMLab、上海AI Lab、騰訊團隊簡易實現了Vision Search Assistant,...
閱讀原文

挨罵 6 個月后,DeepMind 急了:諾獎模型 AlphaFold 3 代碼全網免費送,Nature 也發文力薦!

作者|冬梅、核子可樂 作為獲得諾貝爾獎的蛋白質結構建模工具,AlphaFold 3 的底層代碼現已面向學界開放下載。這標志著基于人工智能的蛋白質結構預測進入了...
閱讀原文

應用突破還是炫技噱頭:大模型能否真正驅動行業升級?

編輯 | 羅燕珊 策劃 | AICon 全球人工智能開發與應用大會 大模型如何驅動行業升級? 近日 InfoQ《極客有約》X AICon 直播欄目特別邀請了商湯科技大模型技術...
閱讀原文

宿敵對決!OpenAI & Anthropic 首席產品官萬字訪談:“現在的模型并不是受限于智能水平,而是受限于評估方法”

來源:AI 科技大本營(ID:rgznai100) 譯:王啟隆 視頻鏈接:youtube.com/watch?v=IxkvVZua28k 作為世界上最強大的兩個 AI 模型背后的產品負責人,是一種什...
閱讀原文

曝OpenAI新旗艦模型“難產”,或明年年初發布

GPT進展放緩,OpenAI撞上數據墻,努力尋找出路。 編譯|汪越 編輯|Panken 智東西11月11日消息,據The Information報道,OpenAI的GPT系列模型改進速度放緩,公...
閱讀原文

全世界最懂大模型的兩個產品經理,一起聊怎么產品

這可能是最懂 AI 產品的兩位 PM 之間的對談。 Kevin Weil,OpenAI CPO(首席產品官),之前曾是 Instagram、Twitter 的產品副總裁。 Mike Kreiger,Anthropic...
閱讀原文

The Information爆料:OpenAI調整大模型方向,Scaling Law撞墻?

文章轉載自「機器之心」。 有研究預計,如果 LLM 保持現在的發展勢頭,預計在 2028 年左右,已有的數據儲量將被全部利用完。屆時,基于大數據的大模型的發展...
閱讀原文
17891011483