標簽:研究者
圖靈獎得主Yoshua Bengio新作:Were RNNs All We Needed?
機器之心報道 編輯:佳琪、蛋醬自從 Transformer 模型問世以來,試圖挑戰其在自然語言處理地位的挑戰者層出不窮。 這次登場的選手,不僅要挑戰 Transformer ...
諾獎得主本庶佑: 真正一流的工作往往沒有在頂級刊物上發表
來源:思廬哲學研究方法應該是多元的,每位學人都可能有適合自己的方法,本庶佑的方法是其中很有特色的一元。本文摘選本庶佑關于求學、研究及創新等方面的觀...
斯坦福新作:無指令調優的指令遵循
機器之心報道 編輯:杜偉、陳陳指令調優(Instruction tuning)是一種優化技術,通過對模型的輸入進行微調,以使其更好地適應特定任務。先前的研究表明,指令...
OpenAI o1智商120,還是被陶哲軒稱為「平庸的研究生」,但實力究竟如何?
機器之心報道 編輯:蛋醬、楊文o1消息滿天飛。自從 OpenAI 發布了新模型 o1 后,它就承包了 AI 領域近幾天的熱搜: 有人用門薩智商測試題「拷問」它,竟測得 ...
檢索總結能力超博士后,首個大模型科研智能體PaperQA2開源了
機器之心報道 編輯:澤南、杜偉這是 AI 智能體在大部分科學研究中超越人類的第一個案例,或許會徹底改變人類與科學文獻互動的方式。最近一段時間,有關 AI 科...
用Test Time換Training Time能讓LLM更強嗎?
機器之心PRO · 會員通訊 Week 36---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. 用 Test Time 換 Training Time 能讓 LLM 更強嗎? Self...
GPT-4o不會數r,被外國小哥原地逼瘋! 谷歌論文揭秘Transformer「數不到n」
新智元報道編輯:Aeneas 好困 【新智元導讀】提示工程師Riley Goodside小哥,依然在用「Strawberry里有幾個r」折磨大模型們,GPT-4o在無限次PUA后,已經被原...
用「AI人」模擬社會學實驗,居然成功了?斯坦福、NYU用GPT-4模仿人類,準確度驚人!
新智元報道編輯:Aeneas 【新智元導讀】斯坦福和NYU的研究者發現,GPT-4這樣的「AI人」,可以被用來復制社會科學實驗了。調查了1萬個AI,結果比真人還真?最...
語言圖像模型大一統!Meta將Transformer和Diffusion融合,多模態AI王者登場
來源:新智元編輯:Aeneas 好困 【導讀】就在剛剛,Meta最新發布的Transfusion,能夠訓練生成文本和圖像的統一模型了!完美融合Transformer和擴散領域之后,...
ECCV 2024 | 引入DiT的原生3D通用框架,適用任意神經場、秒級生成
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
揭秘 Transformer 內部原理:八問八答全解析!
近期,Sakana AI 發表了一篇題為《Transformer Layers as Painters》的論文,探究了預訓練 transformer 中的信息流,并針對僅解碼器和僅編碼器凍結 transform...
明確了:文本數據中加點代碼,訓練出的大模型更強、更通用
機器之心報道 機器之心編輯部代碼知識原來這么重要。如今說起大語言模型(LLM),寫代碼能力恐怕是「君子六藝」必不可少的一項。 在預訓練數據集中包含代碼,...
支持1024幀、準確率近100%,英偉達「LongVILA」開始發力長視頻
機器之心報道 編輯:杜偉、陳陳現在,長上下文視覺語言模型(VLM)有了新的全棧解決方案 ——LongVILA,它集系統、模型訓練與數據集開發于一體。現階段,將模型...
DeepSeek開源數學大模型,高中、大學定理證明新SOTA
機器之心報道 機器之心編輯部DeepSeek-Prover-V1.5 通過結合強化學習和蒙特卡洛樹搜索,顯著提升了證明生成的效率和準確性。AI 技術與數學發現的進展,正前所...
OpenAI爆料者竟然是智能體?斯坦福系創企推出新一代智能體AgentQ
最近,OpenAI 的秘密項目「Q*」一直受到了圈內人士的廣泛關注。上個月,以它為前身、代號為「草莓(Strawberry)」的項目又被曝光了。據推測,該項目能夠提供...
粵公網安備 44011502001135號