標簽:研究者

沒有等來OpenAI開源GPT-4o,等來了開源版VITA

機器之心報道 機器之心編輯部開源領域又傳來好消息。大語言模型 (LLM) 經歷了重大的演變,最近,我們也目睹了多模態大語言模型 (MLLM) 的蓬勃發展,它們表現...
閱讀原文

一直爆料OpenAI「草莓」的賬號,竟然是個智能體?斯坦福系創企「炒作」AgentQ

機器之心報道 編輯:杜偉、佳琪當炒作出了「潑天的流量」,已經沒人關心產品厲不厲害了。最近,OpenAI 的秘密項目「Q*」一直受到了圈內人士的廣泛關注。上個...
閱讀原文

黑匣子被打開了!能玩的Transformer可視化解釋工具,本地運行GPT-2、還可實時推理

機器之心報道 編輯:杜偉、大盤雞都 2024 年,還有人不了解 Transformer 工作原理嗎?快來試一試這個交互式工具吧。2017 年,谷歌在論文《Attention is all y...
閱讀原文

ACL 2024 Oral|我們離真正的多模態思維鏈推理還有多遠?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

八問八答搞懂Transformer內部運作原理

機器之心報道 機器之心編輯部七年前,論文《Attention is all you need》提出了 transformer 架構,顛覆了整個深度學習領域。 如今,各家大模型都以 transfor...
閱讀原文

阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律

機器之心報道 編輯:陳陳、杜偉你規定路線,Tora 來生成相應軌跡的視頻。目前,擴散模型能夠生成多樣化且高質量的圖像或視頻。此前,視頻擴散模型采用 U-Net ...
閱讀原文

小技巧大功效,「僅閱讀兩次提示」讓循環語言模型超越Transformer++

機器之心報道 編輯:杜偉在當前 AI 領域,大語言模型采用的主流架構是 Transformer。不過,隨著 RWKV、Mamba 等架構的陸續問世,出現了一個很明顯的趨勢:在...
閱讀原文

CMU&清華新作:讓LLM自己合成數據來學習,特定任務性能同樣大幅提升

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

「越獄」頻發,如何教會大模型「迷途知返」而不是「將錯就錯」?

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

牛津劍橋「投毒」AI失敗9次登Nature封面,引爆學術圈激辯!AI訓AI能否打破崩潰魔咒?

新智元報道編輯:Aeneas 好困 【新智元導讀】牛津劍橋的9次投毒導致模型崩潰的論文,已經遭到了諸多吐槽:這也能上Nature?學術圈則對此進行了進一步討論,大...
閱讀原文

在機器人頂會 RSS 2024 上,中國的人形機器人研究斬獲最佳論文獎

機器之心報道 機器之心編輯部近日,機器人領域著名會議 RSS(Robotics: Science and Systems) 2024 在荷蘭代爾夫特理工大學圓滿落幕。 盡管會議規模與 NeurI...
閱讀原文

僅微調0.02%參數,性能接近全量微調!上交大推出高效微調統一新范式

ChouJay 投稿量子位 | 公眾號 QbitAIScaling Laws當道,但隨著大模型應用的發展,基礎模型不斷擴大的參數也成了令開發者們頭疼的問題。 為了減輕訓練負擔,Ad...
閱讀原文

清華大合斯坦福大學提出混合注意力機制MoA,大模型解碼速率提高6倍

夕小瑤科技說 原創作者 | Richard 隨著大語言模型的規模不斷擴大,如何在保持模型性能的同時提高其效率,成為了當前研究的熱點問題。最近,清華大學聯合斯坦...
閱讀原文

清華包攬最佳論文+時間檢驗獎,山大獲榮譽提名,SIGIR 2024獎項出爐

機器之心報道 編輯:小舟、陳陳清華成績亮眼。第 47 屆國際計算機協會信息檢索大會(ACM SIGIR) 于 2024 年 7 月 14 日至 18 日在美國華盛頓特區舉行。該會...
閱讀原文

登頂開源AI軟件工程師榜首,UIUC無Agent方案輕松解決SWE-bench真實編程問題

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文
1234513