標(biāo)簽:基線

RNN效率媲美Transformer,谷歌新架構(gòu)兩:同等規(guī)模強(qiáng)于Mamba

機(jī)器之心報(bào)道 機(jī)器之心編輯部去年 12 月,新架構(gòu) Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 發(fā)起了挑戰(zhàn)。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
閱讀原文

微軟、國(guó)科大開(kāi)啟1Bit時(shí)代:大模型轉(zhuǎn)三進(jìn)制,速度快4倍能耗降至1/41

機(jī)器之心報(bào)道 機(jī)器之心編輯部革命性的提升來(lái)了。把大模型的權(quán)重統(tǒng)統(tǒng)改成三元表示,速度和效率的提升讓人害怕。 今天凌晨,由微軟、國(guó)科大等機(jī)構(gòu)提交的一篇論...
閱讀原文

遷移學(xué)習(xí)幫大忙!成都理工大學(xué)搭建 SCDUNet++ 模型進(jìn)行滑坡測(cè)繪

作者:加零 編輯:李寶珠、三羊 成都理工大學(xué)的研究人員提出了一個(gè)名為 SCDUNet++ 的語(yǔ)義分割模型,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和 Transformer 的優(yōu)勢(shì),有效開(kāi)展滑坡測(cè)...
閱讀原文

一張照片,TikTok姐就都能跳舞了

機(jī)器之心報(bào)道編輯:杜偉、小舟動(dòng)畫(huà)視頻生成這幾天火了,這次 NUS、字節(jié)的新框架不僅效果自然流暢,還在視頻保真度方面比其他方法強(qiáng)了一大截。前幾日,阿里研...
閱讀原文

MetaAI提出全新驗(yàn)證鏈框架,大模型通過(guò)“三省吾身”緩解幻覺(jué)現(xiàn)象

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自將門(mén)創(chuàng)投作者:seven_曾子曰:“吾日三省吾身”–出自《論語(yǔ)·學(xué)而》時(shí)至今日,生成幻覺(jué)(hallucination)仍然是大模型研究界中一個(gè)令人非常...
閱讀原文

Meta普林斯頓提出LLM上下文終極解決方案!讓模型化身自主智能體,自行讀取上下文節(jié)點(diǎn)樹(shù)

新智元報(bào)道編輯:潤(rùn)【新智元導(dǎo)讀】LeCun轉(zhuǎn)發(fā)了Meta團(tuán)隊(duì)提出的一種非常特別的處理LLM上下文的方案:通過(guò)把上下文內(nèi)容處理為摘要節(jié)點(diǎn)樹(shù),讓模型自行讀取。這樣...
閱讀原文

讓人恐懼的是,機(jī)器狗已經(jīng)能做這種事了

機(jī)器之心報(bào)道編輯:小舟只用一個(gè)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)操縱,四足機(jī)器人的重大技術(shù)突破。跑酷是一項(xiàng)極限運(yùn)動(dòng),需要參與者以高度動(dòng)態(tài)的方式跨越障礙,對(duì)于大多數(shù)時(shí)候「...
閱讀原文
12