慘遭拒稿的Mamba,7個月后拿下首屆COLM杰出論文,華為實驗室等4篇入選
AIGC動態(tài)歡迎閱讀
原標(biāo)題:慘遭拒稿的Mamba,7個月后拿下首屆COLM杰出論文,華為實驗室等4篇入選
關(guān)鍵字:華為,報告,模型,語言,人工智能
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI頂流新會議首屆COLM成功舉辦,Mamba等4篇論文獲得杰出論文獎。
新架構(gòu)Mamba系列經(jīng)歷了原論文被ICLR拒稿引起熱議等后,Mamba 2后續(xù)被ICML 2024接收,現(xiàn)在開山之作也終于獲得了應(yīng)有的認(rèn)可。
雖然COLM剛剛才辦第一屆,熱鬧程度已不輸老牌頂會,根據(jù)參會者現(xiàn)場返圖,海報區(qū)人擠人。
作為專注語言建模的會議(Conference on Language Modeling),四篇獲獎?wù)撐姆謩e探討了序列建模的新架構(gòu)、語言模型中的評估問題、數(shù)據(jù)中的知識截止問題、以及生成文本的檢測。
Mamba作者Tri Dao參會感覺,由于專注于單一領(lǐng)域,人們投入程度更高。
最佳論文講了啥第一篇:Mamba: Linear-Time Sequence Modeling with Selective State Spaces,團(tuán)隊來自CMU、斯坦福
https://arxiv.org/abs/2312.00752
獲獎理由
Mamba 解決了結(jié)構(gòu)化狀態(tài)空間序列模型中的關(guān)鍵架構(gòu)和實現(xiàn)問題,創(chuàng)造了一個潛在可行的Transformer替代方案。雖然
原文鏈接:慘遭拒稿的Mamba,7個月后拿下首屆COLM杰出論文,華為實驗室等4篇入選
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介: