標簽:架構

面向邊緣端大語言模型的RPP架構芯片與落地實踐 | 演講預告

生成式AI時代,大模型及AIGC的快速發展推動著計算需求的高速增長。 從服務器到邊緣,再到AI手機、AI PC、AIoT、智能汽車,各個領域的AI芯片玩家都面臨著新的...
閱讀原文

上交大新型SRAM存內計算架構「COMPASS」,開啟類腦計算新時代

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

MiniMax 基于 Apache Doris 升級日志系統,PB 數據秒級查詢響應技術實踐

作者|MiniMax 基礎架構研發工程師 Koyomi、香克斯、Tinker 導讀:早期 MiniMax 基于 Grafana Loki 構建了日志系統,在資源消耗、寫入性能及系統穩定性上都面...
閱讀原文

Jamba 1.5發布,最長上下文,非Transformer架構首次成功領先

昨天,號稱當前最強、最高效的長上下文模型——Jamba 1.5 系列發布。 Jamba 是第一個基于 Mamba 架構的生產級模型。Mamba 是由卡內基梅隆大學和普林斯頓大學的...
閱讀原文

紫光同芯重磅發布兩款芯片,未來將重點布局人工智能

8 月 21 日,在 2024 紫光同芯合作伙伴大會上,紫光同芯兩款新品重磅發布:全球首顆開放式架構安全芯片——E450R、國內首顆通過 ASIL D 產品認證的高端旗艦級 R...
閱讀原文

國內首個自研MoE多模態大模型,揭秘騰訊混元多模態理解

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

多虧Transformer,Mamba更強了!僅用1%計算量達新SOTA

明敏 發自 凹非寺量子位 | 公眾號 QbitAIAttention is all you need. 至少在矩陣這兒是。 Mamba架構最新進展:僅需1%計算量,新模型性能達SOTA。 能做到這一...
閱讀原文

爆火神經網絡架構KAN更新2.0!研究者可專屬定制,輕松應對經典物理學研究,作者:和MLP不能互相取代

白交 發自 凹非寺量子位 | 公眾號 QbitAI爆火神經網絡架構KAN,上新了! KAN2.0。 此次與科學問題更深入地融合,可以輕松解出經典物理學研究。 比如發現拉格...
閱讀原文

機器人策略學習的Game Changer?伯克利提出Body Transformer

機器之心報道 編輯:Panda過去幾年間,Transformer 架構已經取得了巨大的成功,同時其也衍生出了大量變體,比如擅長處理視覺任務的 Vision Transformer(ViT...
閱讀原文

計算機科學最重要的3個問題

來源:圖靈人工智能 計算機科學探索信息處理和系統設計 計算機科學是研究信息和信息處理過程,以及它們與計算機系統的設計、實現和應用的科學。它不僅僅關注...
閱讀原文

從GPU到TPU,AI大模型基礎設施的變遷與未來 | 演講預告

生成式AI時代,大模型及AIGC的快速發展推動著計算需求的高速增長。 從服務器到邊緣,再到AI手機、AI PC、AIoT、智能汽車,各個領域的AI芯片玩家都面臨著新的...
閱讀原文

清華太極-Ⅱ 光芯片登上Nature,首創架構突破智能光計算訓練難題

大數據文摘授權轉載學術頭條 撰文:馬雪薇 未來的人工智能(AI)模型,或許可以用“光”來訓練了。長期以來,傳統的電子計算推動著 AI 模型規模的不斷擴展,但...
閱讀原文

Mamba再次挑戰霸主Transformer!首個通用Mamba開源大模型一鳴驚人

新智元報道編輯:編輯部 【新智元導讀】TII開源全球第一個通用的大型Mamba架構模型Falcon Mamba 7B,性能與Transformer架構模型相媲美,在多個基準測試上的均...
閱讀原文

非Transformer架構站起來了!首個純無注意力大模型,超越開源巨頭Llama 3.1

機器之心報道 編輯:杜偉、陳陳Mamba 架構的大模型又一次向 Transformer 發起了挑戰。Mamba 架構模型這次終于要「站」起來了?自 2023 年 12 月首次推出以來...
閱讀原文

論文榮登計算機體系結構頂會ISCA,芯片架構成為邊緣AI最佳并行計算選擇

機器之心發布 機器之心編輯部AI 大模型的爆發帶動了 GPU 的強勁需求,從云端到邊緣滲透的 AI 應用也將帶動邊緣 AI 服務器及加速處理器的需求。通過對比 GPGPU...
閱讀原文
1234514