清程極智 CEO 湯雄超:訓推一體機并非 AI Infra 的未來

AIGC動態(tài)歡迎閱讀
原標題:清程極智 CEO 湯雄超:訓推一體機并非 AI Infra 的未來
關鍵字:模型,芯片,廠商,集群,科技
文章來源:AI科技評論
內(nèi)容字數(shù):0字
內(nèi)容摘要:
較小的一體機難承載巨大的訓練業(yè)務,訓推「對癥下藥」才有機會。作者|朱可軒
編輯|陳彩嫻
早在超算時代,清華大學高性能計算研究中心便一直是解決算力需求相關軟件問題的行家。
“目前 AI Infra 賽道幾家國內(nèi)廠商中,只有我們有過十萬臺服務器的超大規(guī)模國產(chǎn)算力集群的使用和調優(yōu)經(jīng)驗。”湯雄超向 AI 科技評論介紹道。
而“大規(guī)模”會是算力發(fā)展最難解的“題”——
從湯雄超觀察來看,當前業(yè)內(nèi)多有提及的不同品牌 GPU 異構混訓,是芯片產(chǎn)能不足現(xiàn)狀下的一種妥協(xié),未來智算中心可能會回歸同一型號 GPU 的架構以獲得更高的效率,AI 大模型訓練核心歸根到底還是落點在大規(guī)模算力系統(tǒng)本身。
基于前述思考,去年年底,這支來自清華大學計算機系的團隊創(chuàng)辦了清程極智,湯雄超博士擔任公司 CEO,翟季冬教授為公司首席科學家。
除了 AI 訓練面臨的挑戰(zhàn),成立之初,清程極智也看到了推理側的機會。
在一段時期內(nèi),訓推一體機是業(yè)內(nèi)較為流行的產(chǎn)品形態(tài)。但在湯雄超的觀點中,訓推一體機是很難滿足未來的 AI 業(yè)務全部需求的。
論及其中原因,他認為,“訓練和推理兩種業(yè)務對算力系統(tǒng)的需求區(qū)別較大,很難想象出有一個比較小的一體機能
原文鏈接:清程極智 CEO 湯雄超:訓推一體機并非 AI Infra 的未來
聯(lián)系作者
文章來源:AI科技評論
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號