AIGC動態歡迎閱讀
原標題:Nvidia B100/B200/GB200 關鍵技術解讀
關鍵字:芯片,內存,晶體管,帶寬,精度
文章來源:人工智能學家
內容字數:3627字
內容摘要:
對GTC keynote中關于AI基礎設施的關鍵信息整理如下,分三個部分:
芯片
服務器
Superpod
芯片
1. GPU芯片
晶體管數:
B200 GPU的晶體管數量是現有H100的兩倍多,但B200封裝了2080億個晶體管(而H100/H200上?為800億個?)。
這意味著B200芯片封裝密度比H100進一步提高,對管理散熱和功耗也提出了更高的要求。
FP4精度:
引入一種新的計算精度,位寬比FP8進一步降低,B200峰值算力達18P。
FP6精度:
??位寬介于FP4和FP8之間。?
?NV高帶寬接口(Nvidia High Bandwidth Interface):
?B200有兩個Die,高速連接通道NV-HBI達到10TB/s。兩個Die是一個統一的Cuda GPU。NV-HBI會占用一定的芯片面積。?
內存:
?B200每個Die有4個24GB的HBM3e stack,合計一個Cuda GPU有192GB內存,內存帶寬達8TB/s。相比H200時代六個內存控制器,可以減少內存接口的芯片面積,從而使得計算面積可以更大。?
GB200:
?有兩個B200(4個GPU D
原文鏈接:Nvidia B100/B200/GB200 關鍵技術解讀
聯系作者
文章來源:人工智能學家
作者微信:AItists
作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...