標簽:任務

連OpenAI都推不動Scaling Law了?MIT把「測試時訓練」系統研究了一遍,發現還有路

機器之心報道 機器之心編輯部昨天,The Information 的一篇文章讓 AI 社區炸了鍋。 這篇文章透露,OpenAI 下一代旗艦模型的質量提升幅度不及前兩款旗艦模型之...
閱讀原文

o1不是唯一路徑!MIT新研究:在測試時訓練,模型推理能力最高升至5.8倍

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIo1不是通向大模型推理的唯一路徑! MIT的新研究發現,在測試時對大模型進行訓練,可以讓推理水平大幅提升。 在挑戰...
閱讀原文

曝OpenAI新旗艦模型“難產”,或明年年初發布

GPT進展放緩,OpenAI撞上數據墻,努力尋找出路。 編譯|汪越 編輯|Panken 智東西11月11日消息,據The Information報道,OpenAI的GPT系列模型改進速度放緩,公...
閱讀原文

LoRA、完全微調到底有何不同?MIT 21頁論文講明白了

機器之心報道 編輯:陳陳、小舟本文旨在了解兩種微調大型語言模型方法之間的差異:完全微調和低秩自適應 (LoRA)。這兩種方法都用于將預訓練模型適應特定的下...
閱讀原文

微軟開源5級通用AI Agent:瀏覽網頁、查論文,無所不能!

大會預告12月5日-6日,2024中國生成式AI大會(上海站)將舉辦。上海科大助理教授、博導顧家遠,騰訊優圖實驗室天衍研究中心負責人吳賢,銀河通用機器人合伙人...
閱讀原文

空間智能版ImageNet來了!李飛飛吳佳俊團隊出品

衡宇 發自 凹非寺量子位 | 公眾號 QbitAI空間智能版ImageNet來了,來自斯坦福李飛飛吳佳俊團隊! HourVideo,一個用于評估多模態模型對長達一小時視頻理解能...
閱讀原文

NeurIPS 2024 (Oral) | 如何量化與提升思維鏈的推理能力邊界?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

高能干貨分享,有關提示詞工程的一切都在這份教程里

機器之心報道 編輯:佳琪、Panda想讓 AI 幫你自動搞定任務,離不開要在聊天框內用提示詞對它發號施令。 但找到合適的提示詞并不容易,這需要設計、優化和評估...
閱讀原文

MetaGPT開源自動生成智能體工作流,4.55%成本超GPT-4o

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

「通用大腦」來了!MIT何愷明用大模型思維玩出機器人預訓練新花樣

大模型的預訓練方法也適用機器人,復雜數據無需“量身定做”,也能完美對接。作者丨劉潔 編輯丨岑峰 在機器人領域,一場關于“通用智能”的探索正如火如荼地展開...
閱讀原文

一個彈窗整懵Claude,瞬間玩不轉電腦了 | 斯坦福&港大新研究

一水 發自 凹非寺量子位 | 公眾號 QbitAI納尼?AI Agent容易受到彈幕影響! 甚至比人類更容易。 事情是這樣的,3位來自斯坦福、港大的研究人員發現: 人類有...
閱讀原文

智能體首次達到Kaggle Grandmaster水平,華為用結構化推理補齊思維鏈短板

機器之心報道 編輯:Panda前些時日,AI 大模型開始掌握操作計算機的能力,但整體而言,它們與物理世界互動的能力仍處于早期階段。 為了提高 LLM 在復雜的現實...
閱讀原文

聚焦「視聽觸感官」協同配合的具身精細操縱,人大胡迪團隊領銜探索機器人模態時變性挑戰

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

體驗 iMac M4 后,我發現了蘋果的小心思和喬布斯的影子

蘋果常青樹 回歸之作2001 年,《老友記》第七季正在美國播出,斬獲了約 2000 萬平均收視人數,位列當年全美電視節目收視率的前五名。 這部從上世紀走來的經典...
閱讀原文

玩轉「智能體魔方」!清華推出AgentSquare模塊化搜索框架,開啟AI智能體高速進化時代

新智元報道編輯:LRST 好困 【新智元導讀】AI智能體能像有機生命一樣自適應演化嗎?最近清華大學團隊提出了AgentSquare模塊化智能體設計框架,通過標準化的模...
閱讀原文
123448