慘遭拒稿的Mamba,7個(gè)月后拿下首屆COLM杰出論文,華為實(shí)驗(yàn)室等4篇入選
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:慘遭拒稿的Mamba,7個(gè)月后拿下首屆COLM杰出論文,華為實(shí)驗(yàn)室等4篇入選
關(guān)鍵字:華為,報(bào)告,模型,語(yǔ)言,人工智能
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI頂流新會(huì)議首屆COLM成功舉辦,Mamba等4篇論文獲得杰出論文獎(jiǎng)。
新架構(gòu)Mamba系列經(jīng)歷了原論文被ICLR拒稿引起熱議等后,Mamba 2后續(xù)被ICML 2024接收,現(xiàn)在開山之作也終于獲得了應(yīng)有的認(rèn)可。
雖然COLM剛剛才辦第一屆,熱鬧程度已不輸老牌頂會(huì),根據(jù)參會(huì)者現(xiàn)場(chǎng)返圖,海報(bào)區(qū)人擠人。
作為專注語(yǔ)言建模的會(huì)議(Conference on Language Modeling),四篇獲獎(jiǎng)?wù)撐姆謩e探討了序列建模的新架構(gòu)、語(yǔ)言模型中的評(píng)估問(wèn)題、數(shù)據(jù)中的知識(shí)截止問(wèn)題、以及生成文本的檢測(cè)。
Mamba作者Tri Dao參會(huì)感覺,由于專注于單一領(lǐng)域,人們投入程度更高。
最佳論文講了啥第一篇:Mamba: Linear-Time Sequence Modeling with Selective State Spaces,團(tuán)隊(duì)來(lái)自CMU、斯坦福
https://arxiv.org/abs/2312.00752
獲獎(jiǎng)理由
Mamba 解決了結(jié)構(gòu)化狀態(tài)空間序列模型中的關(guān)鍵架構(gòu)和實(shí)現(xiàn)問(wèn)題,創(chuàng)造了一個(gè)潛在可行的Transformer替代方案。雖然
原文鏈接:慘遭拒稿的Mamba,7個(gè)月后拿下首屆COLM杰出論文,華為實(shí)驗(yàn)室等4篇入選
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介: