英偉達 Blackwell 芯片又又又曝問題!老黃大半年沒搞定,微軟們被迫換貨、換方案
AIGC動態(tài)歡迎閱讀
原標(biāo)題:英偉達 Blackwell 芯片又又又曝問題!老黃大半年沒搞定,微軟們被迫換貨、換方案
關(guān)鍵字:小米,芯片,機架,模型,問題
文章來源:AI前線
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
整理 | 燕珊
據(jù) The Information 最新報道,英偉達下一代 Blackwell 芯片在高密度服務(wù)器機架現(xiàn)嚴(yán)重過熱問題,導(dǎo)致設(shè)計變更和客戶方面的部署延遲。這讓 Google、Meta 和微軟等主要客戶對能否按時部署 Blackwell 產(chǎn)生擔(dān)憂。
過熱問題或拖累交付計劃
英偉達早在今年 3 月發(fā)布了 Blackwell 系列產(chǎn)品,原計劃是 2024 年第二季度發(fā)貨,但之前已經(jīng)因為設(shè)計缺陷而推遲。
據(jù)報道,Blackwell GPU 在高密度服務(wù)器機架中面臨嚴(yán)重的過熱問題。這些高密度服務(wù)器機架集成了 72 塊 AI 芯片,每個機架功耗高達 120kW。但高密度和高功耗的設(shè)計帶來了散熱難題,不僅限制了 GPU 性能,還可能損壞硬件組件。
為解決這一問題,英偉達不得不多次調(diào)整機架設(shè)計,并對冷卻系統(tǒng)進行工程修訂。據(jù)悉,英偉達已指示供應(yīng)商實施多項改進措施。
英偉達對此回應(yīng)稱,散熱問題和設(shè)計變更是技術(shù)開發(fā)中的正常流程,并重申正在與云服務(wù)商和供應(yīng)商合作,確保最終產(chǎn)品符合性能和可靠性要求。戴爾宣布,基于英偉達 GB200 NVL72 架構(gòu)且采用液冷技術(shù)的服務(wù)器機架已發(fā)貨
在等待 B
原文鏈接:英偉達 Blackwell 芯片又又又曝問題!老黃大半年沒搞定,微軟們被迫換貨、換方案
聯(lián)系作者
文章來源:AI前線
作者微信:
作者簡介: