HPN 7.0:阿里云新一代萬卡集群網(wǎng)絡(luò)架構(gòu)
AIGC動態(tài)歡迎閱讀
原標(biāo)題:HPN 7.0:阿里云新一代萬卡集群網(wǎng)絡(luò)架構(gòu)
關(guān)鍵字:騰訊,報(bào)告,阿里,拓?fù)?/a>,通信
文章來源:智猩猩AGI
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業(yè)部高級總監(jiān)王宏強(qiáng),清華大學(xué)交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲,珠海芯動力創(chuàng)始人兼CEO李原,“吳文俊2023人工智能芯片專項(xiàng)獎”第一完、鋒行致遠(yuǎn)創(chuàng)始人兼CEO孫唐等嘉賓已確認(rèn)出席。歡迎報(bào)名或購票參會~01背景本文中,我們簡單介紹 C4 底層的阿里云新一代智算集群網(wǎng)絡(luò)架構(gòu) HPN 7.0。阿里在最近的智源大會上也有介紹,可以參考 https://event.baai.ac.cn/live/795,其提到了幾個(gè)關(guān)鍵詞:雙上聯(lián),雙平面,多軌,以及單層千卡,兩層萬卡。上面提到的幾個(gè)介紹可以參考:
萬卡 GPU 集群互聯(lián):硬件配置和網(wǎng)絡(luò)設(shè)計(jì)
萬卡 GPU 集群實(shí)戰(zhàn):探索 LLM 預(yù)訓(xùn)練的挑戰(zhàn)
阿里 C4:通信驅(qū)動加速大規(guī)模并行訓(xùn)練效率
剖析大規(guī)模 GPU 集群:針對 LLM 場景的挑戰(zhàn)和優(yōu)化
02拓?fù)淙缦聢D所示(圖片來自 星融元針對LLM大模型承載網(wǎng)發(fā)布星智AI網(wǎng)絡(luò)解決方案)為常見的三層無阻塞 Fat-Tree 拓?fù)洌⊿uperSpine-Spine-Leaf),可以將兩層的 Spine-Leaf 看做一個(gè)
原文鏈接:HPN 7.0:阿里云新一代萬卡集群網(wǎng)絡(luò)架構(gòu)
聯(lián)系作者
文章來源:智猩猩AGI
作者微信:
作者簡介: