AIGC動態歡迎閱讀
原標題:探秘馬斯克全球最大AI集群Colossus:10萬張英偉達 H100,122天建成
關鍵字:機架,熱交換器,集群,數據中心,服務器
文章來源:AI范兒
內容字數:0字
內容摘要:
今天,我們將發布 xAI Colossus 超級計算機之旅。對于那些聽說過埃隆·馬斯克的 xAI 在孟菲斯建造巨型 AI 超級計算機的人來說,這就是那個集群。這個價值數十億美元的 AI 集群擁有 100,000 個 NVIDIA H100 GPU,不僅規模大,而且建造速度快。僅用 122 天,團隊就建造了這個巨型集群。今天,我們將帶您參觀大樓內部。
xAI 的超微液冷機架Colossus(巨人) 的基本構建模塊是 Supermicro (超微)液冷機架。它由 8 臺 4U 服務器組成,每臺服務器配備 8 個 NVIDIA H100,每臺機架總共有 64 個 GPU。8 臺這樣的 GPU 服務器加上一臺Supermicro 冷卻液分配單元 (CDU)和相關硬件構成了一個 GPU 計算機架。
XAI 巨人數據中心的超微液冷節點低角度視圖
這些機架以八個為一組排列,共有 512 個 GPU,并通過網絡連接形成迷你集群,融入到這個更大的系統中。
XAI 巨人數據中心的超微 4U 通用 GPU 液冷服務器
在這里,xAI 采用了超微的 4U 通用 GPU 系統。這些服務器是目前市場上最先進的人工
原文鏈接:探秘馬斯克全球最大AI集群Colossus:10萬張英偉達 H100,122天建成
聯系作者
文章來源:AI范兒
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...