AIGC動態歡迎閱讀
原標題:HPN 7.0:阿里云新一代萬卡集群網絡架構
關鍵字:騰訊,報告,阿里,拓撲,通信
文章來源:智猩猩AGI
內容字數:0字
內容摘要:
9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業部高級總監王宏強,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲,珠海芯動力創始人兼CEO李原,“吳文俊2023人工智能芯片專項獎”第一完、鋒行致遠創始人兼CEO孫唐等嘉賓已確認出席。歡迎報名或購票參會~01背景本文中,我們簡單介紹 C4 底層的阿里云新一代智算集群網絡架構 HPN 7.0。阿里在最近的智源大會上也有介紹,可以參考 https://event.baai.ac.cn/live/795,其提到了幾個關鍵詞:雙上聯,雙平面,多軌,以及單層千卡,兩層萬卡。上面提到的幾個介紹可以參考:
萬卡 GPU 集群互聯:硬件配置和網絡設計
萬卡 GPU 集群實戰:探索 LLM 預訓練的挑戰
阿里 C4:通信驅動加速大規模并行訓練效率
剖析大規模 GPU 集群:針對 LLM 場景的挑戰和優化
02拓撲如下圖所示(圖片來自 星融元針對LLM大模型承載網發布星智AI網絡解決方案)為常見的三層無阻塞 Fat-Tree 拓撲(SuperSpine-Spine-Leaf),可以將兩層的 Spine-Leaf 看做一個
聯系作者
文章來源:智猩猩AGI
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...