原標題:英偉達年終大禮,最強AI GPU曝光!全新B300讓o1/o3推理性能上天算力爆表
文章來源:新智元
內容字數:7876字
英偉達圣誕大禮包:GB300/B300性能大幅提升,供應鏈重構
英偉達在圣誕節前夕發布了全新一代AI GPU——GB300和B300,算力和顯存直接提升50%,模型推理訓練性能史詩級提升,并打破了以往HBM升級導致利潤率下降的魔咒。但這背后,也隱藏著供應鏈重構和技術挑戰。
1. 性能大幅提升
相比于前代產品B200,B300/GB300在算力和顯存方面都有顯著提升:
- 算力FLOPS性能提升50%,功耗增加200W。GB300和B300 HGX的TDP分別達到1.4KW和1.2KW。
- 內存HBM容量增加50%,從192GB提升至288GB,堆疊方案從8層升級為12層,帶寬仍為8TB/s。
這些改進尤其利好大型語言模型的訓練和推理,例如OpenAI的o3模型。通過H100和H200的對比,可以看出更大、更快的顯存帶來的性能提升,包括交互性能提升43%,每秒token生成量提升3倍,成本降低約3倍。
2. NVLink的絕對優勢
英偉達的NVLink技術,特別是NVL72,成為其核心競爭力。NVL72允許72個GPU以超低延遲協同工作,共享顯存,實現更高交互性、更長思維鏈,提升模型智能水平,并在經濟效益上實現10倍以上提升。
3. 供應鏈重構:機遇與挑戰
GB300的推出帶來了供應鏈的重大調整。英偉達將核心組件(B300、Grace CPU、基板管理控制器)供應,其他組件則由終端客戶自行采購。這使得更多廠商能夠參與計算托盤制造,但也對原有供應商例如緯創和富士康工業互聯網造成了影響。
VRM供應鏈也發生了變化,超大規模數據中心運營商和OEM將直接從供應商采購板載VRM。互聯技術方面,GB300搭載了800G ConnectX-8網絡接口卡,帶寬提升100%。
4. 超算中心的影響
GB300為超算中心提供了更大的定制自,但同時也帶來了更高的設計和驗證成本。一些超算中心能夠快速適應,而另一些則進展緩慢。亞馬遜的案例體現了定制化受限帶來的成本增加,而GB300則有望幫助他們優化成本。
5. 對英偉達利潤的影響
雖然GB300的BOM成本增加了約2500美元,但由于不再提供配套內存和PCB成本節省,英偉達實現了成本平衡,GB300相對于GB200的增量毛利率達到73%,打破了HBM升級通常導致利潤率下降的慣例。
總而言之,英偉達的GB300/B300不僅是簡單的性能升級,更是對AI計算產業鏈的一次深刻重塑,為其帶來了顯著的性能提升和利潤增長,但也帶來了供應鏈的調整和技術挑戰。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。