清程極智 CEO 湯雄超:訓(xùn)推一體機(jī)并非 AI Infra 的未來
AIGC動態(tài)歡迎閱讀
原標(biāo)題:清程極智 CEO 湯雄超:訓(xùn)推一體機(jī)并非 AI Infra 的未來
關(guān)鍵字:模型,芯片,廠商,集群,科技
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
較小的一體機(jī)難承載巨大的訓(xùn)練業(yè)務(wù),訓(xùn)推「對癥下藥」才有機(jī)會。作者|朱可軒
編輯|陳彩嫻
早在超算時代,清華大學(xué)高性能計算研究中心便一直是解決算力需求相關(guān)軟件問題的行家。
“目前 AI Infra 賽道幾家國內(nèi)廠商中,只有我們有過十萬臺服務(wù)器的超大規(guī)模國產(chǎn)算力集群的使用和調(diào)優(yōu)經(jīng)驗(yàn)。”湯雄超向 AI 科技評論介紹道。
而“大規(guī)模”會是算力發(fā)展最難解的“題”——
從湯雄超觀察來看,當(dāng)前業(yè)內(nèi)多有提及的不同品牌 GPU 異構(gòu)混訓(xùn),是芯片產(chǎn)能不足現(xiàn)狀下的一種妥協(xié),未來智算中心可能會回歸同一型號 GPU 的架構(gòu)以獲得更高的效率,AI 大模型訓(xùn)練核心歸根到底還是落點(diǎn)在大規(guī)模算力系統(tǒng)本身。
基于前述思考,去年年底,這支來自清華大學(xué)計算機(jī)系的團(tuán)隊(duì)創(chuàng)辦了清程極智,湯雄超博士擔(dān)任公司 CEO,翟季冬教授為公司首席科學(xué)家。
除了 AI 訓(xùn)練面臨的挑戰(zhàn),成立之初,清程極智也看到了推理側(cè)的機(jī)會。
在一段時期內(nèi),訓(xùn)推一體機(jī)是業(yè)內(nèi)較為流行的產(chǎn)品形態(tài)。但在湯雄超的觀點(diǎn)中,訓(xùn)推一體機(jī)是很難滿足未來的 AI 業(yè)務(wù)全部需求的。
論及其中原因,他認(rèn)為,“訓(xùn)練和推理兩種業(yè)務(wù)對算力系統(tǒng)的需求區(qū)別較大,很難想象出有一個比較小的一體機(jī)能
原文鏈接:清程極智 CEO 湯雄超:訓(xùn)推一體機(jī)并非 AI Infra 的未來
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介: