標簽：研究者

圖靈獎得主Yoshua Bengio新作：Were RNNs All We Needed?

機器之心報道編輯：佳琪、蛋醬自從 Transformer 模型問世以來，試圖挑戰其在自然語言處理地位的挑戰者層出不窮。這次登場的選手，不僅要挑戰 Transformer ...

閱讀原文

AIGC動態

1年前 (2024)

諾獎得主本庶佑: 真正一流的工作往往沒有在頂級刊物上發表

來源：思廬哲學研究方法應該是多元的，每位學人都可能有適合自己的方法，本庶佑的方法是其中很有特色的一元。本文摘選本庶佑關于求學、研究及創新等方面的觀...

閱讀原文

AIGC動態

1年前 (2024)

斯坦福新作：無指令調優的指令遵循

機器之心報道編輯：杜偉、陳陳指令調優（Instruction tuning）是一種優化技術，通過對模型的輸入進行微調，以使其更好地適應特定任務。先前的研究表明，指令...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI o1智商120，還是被陶哲軒稱為「平庸的研究生」，但實力究竟如何？

機器之心報道編輯：蛋醬、楊文o1消息滿天飛。自從 OpenAI 發布了新模型 o1 后，它就承包了 AI 領域近幾天的熱搜：有人用門薩智商測試題「拷問」它，竟測得 ...

閱讀原文

AIGC動態

1年前 (2024)

檢索總結能力超博士后，首個大模型科研智能體PaperQA2開源了

機器之心報道編輯：澤南、杜偉這是 AI 智能體在大部分科學研究中超越人類的第一個案例，或許會徹底改變人類與科學文獻互動的方式。最近一段時間，有關 AI 科...

閱讀原文

AIGC動態

1年前 (2024)

用Test Time換Training Time能讓LLM更強嗎？

機器之心PRO · 會員通訊 Week 36---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. 用 Test Time 換 Training Time 能讓 LLM 更強嗎？ Self...

閱讀原文

AIGC動態

1年前 (2024)

GPT-4o不會數r，被外國小哥原地逼瘋！谷歌論文揭秘Transformer「數不到n」

新智元報道編輯：Aeneas 好困【新智元導讀】提示工程師Riley Goodside小哥，依然在用「Strawberry里有幾個r」折磨大模型們，GPT-4o在無限次PUA后，已經被原...

閱讀原文

AIGC動態

1年前 (2024)

用「AI人」模擬社會學實驗，居然成功了？斯坦福、NYU用GPT-4模仿人類，準確度驚人！

新智元報道編輯：Aeneas 【新智元導讀】斯坦福和NYU的研究者發現，GPT-4這樣的「AI人」，可以被用來復制社會科學實驗了。調查了1萬個AI，結果比真人還真？最...

閱讀原文

AIGC動態

1年前 (2024)

語言圖像模型大一統！Meta將Transformer和Diffusion融合，多模態AI王者登場

來源：新智元編輯：Aeneas 好困【導讀】就在剛剛，Meta最新發布的Transfusion，能夠訓練生成文本和圖像的統一模型了！完美融合Transformer和擴散領域之后，...

閱讀原文

AIGC動態

1年前 (2024)

ECCV 2024 | 引入DiT的原生3D通用框架，適用任意神經場、秒級生成

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術...

閱讀原文

AIGC動態

1年前 (2024)

揭秘 Transformer 內部原理：八問八答全解析！

近期，Sakana AI 發表了一篇題為《Transformer Layers as Painters》的論文，探究了預訓練 transformer 中的信息流，并針對僅解碼器和僅編碼器凍結 transform...

閱讀原文

AIGC動態

1年前 (2024)

明確了：文本數據中加點代碼，訓練出的大模型更強、更通用

機器之心報道機器之心編輯部代碼知識原來這么重要。如今說起大語言模型（LLM），寫代碼能力恐怕是「君子六藝」必不可少的一項。在預訓練數據集中包含代碼，...

閱讀原文

AIGC動態

1年前 (2024)

支持1024幀、準確率近100％，英偉達「LongVILA」開始發力長視頻

機器之心報道編輯：杜偉、陳陳現在，長上下文視覺語言模型（VLM）有了新的全棧解決方案 ——LongVILA，它集系統、模型訓練與數據集開發于一體。現階段，將模型...

閱讀原文

AIGC動態

1年前 (2024)

DeepSeek開源數學大模型，高中、大學定理證明新SOTA

機器之心報道機器之心編輯部DeepSeek-Prover-V1.5 通過結合強化學習和蒙特卡洛樹搜索，顯著提升了證明生成的效率和準確性。AI 技術與數學發現的進展，正前所...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI爆料者竟然是智能體？斯坦福系創企推出新一代智能體AgentQ

最近，OpenAI 的秘密項目「Q*」一直受到了圈內人士的廣泛關注。上個月，以它為前身、代號為「草莓（Strawberry）」的項目又被曝光了。據推測，該項目能夠提供...

閱讀原文

AIGC動態

1年前 (2024)

123 4…13