標簽:基線

RNN效率媲美Transformer,谷歌新架構兩:同等規模強于Mamba

機器之心報道 機器之心編輯部去年 12 月,新架構 Mamba 引爆了 AI 圈,向屹立不倒的 Transformer 發起了挑戰。如今,谷歌 DeepMind「Hawk 」和「Griffin 」的...
閱讀原文

微軟、國科大開啟1Bit時代:大模型轉三進制,速度快4倍能耗降至1/41

機器之心報道 機器之心編輯部革命性的提升來了。把大模型的權重統統改成三元表示,速度和效率的提升讓人害怕。 今天凌晨,由微軟、國科大等機構提交的一篇論...
閱讀原文

遷移學習幫大忙!成都理工大學搭建 SCDUNet++ 模型進行滑坡測繪

作者:加零 編輯:李寶珠、三羊 成都理工大學的研究人員提出了一個名為 SCDUNet++ 的語義分割模型,結合卷積神經網絡和 Transformer 的優勢,有效開展滑坡測...
閱讀原文

一張照片,TikTok姐就都能跳舞了

機器之心報道編輯:杜偉、小舟動畫視頻生成這幾天火了,這次 NUS、字節的新框架不僅效果自然流暢,還在視頻保真度方面比其他方法強了一大截。前幾日,阿里研...
閱讀原文

MetaAI提出全新驗證鏈框架,大模型通過“三省吾身”緩解幻覺現象

大數據文摘授權轉載自將門創投作者:seven_曾子曰:“吾日三省吾身”–出自《論語·學而》時至今日,生成幻覺(hallucination)仍然是大模型研究界中一個令人非常...
閱讀原文

Meta普林斯頓提出LLM上下文終極解決方案!讓模型化身自主智能體,自行讀取上下文節點樹

新智元報道編輯:潤【新智元導讀】LeCun轉發了Meta團隊提出的一種非常特別的處理LLM上下文的方案:通過把上下文內容處理為摘要節點樹,讓模型自行讀取。這樣...
閱讀原文

讓人恐懼的是,機器狗已經能做這種事了

機器之心報道編輯:小舟只用一個神經網絡實現操縱,四足機器人的重大技術突破。跑酷是一項極限運動,需要參與者以高度動態的方式跨越障礙,對于大多數時候「...
閱讀原文
12