標簽:架構

網絡架構如何支持超萬卡的大規模 AI 訓練?

演講嘉賓 | 席永青 AI 訓練場景的算力 Scaling 核心是網絡,依賴于大規模、高性能的數據中心網絡集群來實現算力的規模擴展,為此,阿里云設計了 HPN7.0 架構...
閱讀原文

作為人工智能下一個關口的意識研究:從加扎尼加的意識學說切入

來源:神經現實 摘要隨著近年來人工智能(AI)的驚人進步,AI 是否具有意識以及如何構建有意識的 AI 系統越來 越受到學界和公眾的關注。要回答這類問題,我們...
閱讀原文

AI手機PC大爆發,Arm從軟硬件到生態發力,打造行業AI百寶箱

生成式AI,Arm拋出AI軟硬件加速全家桶。 作者|云鵬 編輯|漠影 隨著“Gen-AI”時代的到來,AI手機、AI PC等關鍵核心移動設備都在快速與生成式AI結合,越來越多的...
閱讀原文

英特爾牙膏擠爆:功耗降40%、AI算力120TOPS,你的下一代筆記本沒有內存條了

西風 發自 凹非寺量子位 | 公眾號 QbitAI英特爾為了AI,再次做出重大架構變革: 像手機一樣搞起SoC(系統級芯片),你的下一臺筆記本不會再有獨立內存條。 剛...
閱讀原文

AMD提前發布新AI芯片,硬剛英偉達!Zen 5架構性能提高一倍

夕小瑤科技說 原創作者 | 海野眼看著英偉達要打破摩爾定律,開啟一年一更的新時代;搭載高通驍龍新芯片的設備,也將于數日后上市。AMD這坐不住?。哼@風頭怎么...
閱讀原文

老黃自己卷自己!GPU要一年更新一代!預告新動作:AI工廠將吞噬一切

夕小瑤科技說 原創作者 | 小戲 站在 AI 時代風口浪尖的弄潮兒英偉達又為大家帶來了一場科技饕餮盛宴! 昨晚 7 點,坐標中國臺灣大學體育場,英偉達 CEO 黃仁...
閱讀原文

單GPU訓練一天,Transformer在100位數字加法上就達能到99%準確率

機器之心報道 機器之心編輯部乘法和排序也有效。 自 2017 年被提出以來,Transformer 已成為 AI 大模型的主流架構,一直穩站 C 位。 但所有研究者都不得不承...
閱讀原文

驍龍 8 Gen4 發布時間確定,小米或再次首發

驍龍 8 Gen4 全面升級? 繼高通去年十月發布驍龍 8 Gen3 后,已過去了三個季度。移動端的 9300 與 8 Gen3 之爭,也隨著本月最后一臺 8 Gen3 超大杯發布而落下...
閱讀原文

楊立昆教授關于通用人工智能世界模型JEPA觀點及爭議

-本篇附錄楊立昆教授世界模型JEPA論文摘要簡介和爭議背景,全文將在下一篇播出,論文全文約有4.6萬字。?????? 目錄 1世界模型JEPA觀點及爭議背景 2編譯作者觀...
閱讀原文

MoE 高效訓練的 A/B 面:與魔鬼做交易,用「顯存」換「性能」

在高效訓練與高顯存占用之間橫跳的 MoE,更像是一門妥協的藝術。作者|房曉楠 編輯|陳彩嫻 MoE 會成為未來大模型訓練的新方向嗎? 這是人們發現 MoE 架構可...
閱讀原文

Meta首席科學家:不要從事LLM研究!它已經被大公司主導

點擊上方藍字關注我們“摘要:在巴黎VivaTech科技盛會上,Meta AI首席Yann LeCun建議學生不要專注于大型語言模型(LLMs)的研究,并鼓勵開發新一代人工智能系...
閱讀原文

創業總結!大模型RAG系統三個月的開發心得和思考

直播預告 | 5月28日10點,「智猩猩AI新青年講座」第236講正式開講,密歇根大學安娜堡分校在讀博士生張揮杰將直播講解《利用多級框架和多解碼器架構提高擴散模...
閱讀原文

Scaling Law的盡頭是什么?|甲子引力X

大模型的“摩爾定律”。2024年5月15日,由中國科技產業智庫「甲子光年」主辦、中關村東升科學城協辦的「AI創生時代——2024甲子引力X科技產業新風向」大會在北京...
閱讀原文

利用多級框架和多解碼器架構提高擴散模型訓練效率 | 密歇根大學安娜堡分校在讀博士張揮杰主講

「智猩猩AI新青年講座」由智猩猩出品,致力于邀請青年學者,主講他們在生成式AI、LLM、AI Agent、CV等人工智能領域的最新重要研究成果。 AI新青年是加速人工...
閱讀原文

英偉達股價首次破1000美元!黃仁勛:Token生意將創造100萬億價值

明敏 發自 凹非寺量子位 | 公眾號 QbitAI英偉達股價,盤后首次沖破1000美元大關! 隨著本財年第一季度財報公布,多項業績數據超出預期。盤后英偉達股價暴漲6%...
閱讀原文
14567814