標簽:記憶

鄂維南院士領銜新作:大模型不止有RAG、參數存儲,還有第3種記憶

機器之心報道 編輯:陳陳2.4B 的 Memory3比更大的 LLM 和 RAG 模型獲得了更好的性能。近年來,大型語言模型 (LLM) 因其非凡的性能而獲得了前所未有的關注。然...
閱讀原文

院士領銜推出大模型的第3種記憶:比參數存儲和RAG都便宜,2.4B模型越級打13B

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI給大模型加上第三種記憶格式,把寶貴的參數從死記硬背知識中解放出來! 中科院院士鄂維南領銜,上海算法創新研究院等...
閱讀原文

開源視頻版GPT-4o?快速記憶,實時問答,拿下CVPR'24長視頻問答競賽冠軍

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

Nature最新:劉智慧/孫文斐/Thomas C. Südhof等合作揭示社交學習長期記憶的鞏固機制

來源:小柯生命 2024年7月3日23時,美國斯坦福大學Thomas C. Südhof及Stephen R. Quake教授團隊(劉智慧和孫文斐為共同第一作者,劉智慧為共同通訊作者),合...
閱讀原文

? 這才是 Vision Pro 的锏

Vision Pro 的所有功能里,「空間照片」和「空間視頻」是我們感受最深的功能。 它們就像容器,把記憶儲存起來;而 Vision Pro 就像「哈利波特」世界里的「冥...
閱讀原文

CAAI名譽理事長李德毅院士:認知的形式化

來源:腦機接口社區 近日,中國人工智能學會名譽理事長李德毅院士牽頭3位學者共同完成《認知的形式化》一文,并在《中國基礎科學》(雙月刊)上發表。認知的...
閱讀原文

麻省理工開發一款AI「時光機器」,穿越未來和60歲自己對話,可顯著減輕焦慮

夕小瑤科技說 原創作者 | 付奶茶你有沒有想象過這樣一個場景,穿越到未來,與未來的自己進行一場對話。 現在借助AI,幻想可以照進現實了。 麻省理工學院(MITI...
閱讀原文

Agent技術洞察01:增強大語言模型 Agents 的工作記憶能力

直播預告 | 6月14日上午10點,「智猩猩AI新青年講座」第239講正式開講,莫納什大學在讀博士馬鑫將直播講解《DiT架構在視頻生成模型中的應用與擴展》,歡迎掃...
閱讀原文

候選CVPR 2024最佳論文!深圳大手香港理工發布MemSAM:將 「分割一切」模型用于醫學視頻分割

作者:梅菜 編輯:李寶珠,三羊 深圳大學計算機與軟件學院和香港理工大學智能健康研究中心聯合提出了一種新穎的超聲心動圖視頻分割模型 MemSAM,與現有模型相...
閱讀原文

ChatGPT真能記住你的話嗎?DeepMind與開源大佬揭示LLM記憶之謎

新智元報道編輯:喬楊 【新智元導讀】LLM有記憶能力嗎?有,也沒有。雖然ChatGPT聊天時好像可以記住你之前說的話,但實際上,模型在推理時記不住任何內容,而...
閱讀原文

長短時記憶RAG來啦,仿照人腦結構,成本降低20倍,表現提高20%!

夕小瑤科技說 原創作者 | Richard自從GPT-4問世之后,大模型似乎變得愈發聰明,擁有了'百科全書'般的知識儲備。但它們真的已經接近人類智慧了嗎? 事實并非如...
閱讀原文

基礎架構競爭激烈,LSTM原作者提出指數門控xLSTM,性能直逼Transformer和Mamba

大數據文摘授權轉載自將門創投 作者:seven_ 經典長短時記憶網絡(LSTM)架構最早可以追溯到20世紀90年代,因其獨特的常量誤差傳遞(constant error carousel...
閱讀原文

Nature | 從波動到穩定:小鼠研究揭示工作記憶穩定化的神經機制

來源:生物探索 引言工作記憶(Working Memory, WM)是指在短暫時間內存儲和操作信息的能力,它對大多數認知功能至關重要。然而,長期以來,關于工作記憶在群...
閱讀原文

華為最新研究挑戰Scaling Law

克雷西 發自 凹非寺量子位 | 公眾號 QbitAI“Scaling Law不是萬金油”——關于大模型表現,華為又提出了新理論。 他們發現,一些現象無法用Scaling Law來解釋,進...
閱讀原文

神秘模型"gpt2-chatbot"現身,引發GPT-4.5/GPT-5瘋狂猜想

大數據文摘受權轉載自頭部科技 文丨Congerry OpenAI放出了一個迷霧彈。 當Google、Meta、Anthropic等公司都在猛推大模型的時候,OpenAI除了對GPT-4修修補補,...
閱讀原文
1234