阿里云:進一步壓榨云上GPU資源,將大模型訓(xùn)推效率最大化丨GenAICon 2024
AIGC動態(tài)歡迎閱讀
原標(biāo)題:阿里云:進一步壓榨云上GPU資源,將大模型訓(xùn)推效率最大化丨GenAICon 2024
關(guān)鍵字:模型,顯存,性能,場景,帶寬
文章來源:智東西
內(nèi)容字?jǐn)?shù):9149字
內(nèi)容摘要:
阿里云用創(chuàng)新調(diào)優(yōu)方法節(jié)省通信開銷。
2024中國生成式AI大會于4月18-19日在北京舉行,在大會第二天的主會場AI Infra專場上,阿里云高級技術(shù)專家、阿里云異構(gòu)計算AI推理團隊負責(zé)人以《AI基礎(chǔ)設(shè)施的演進與挑戰(zhàn)》為題發(fā)表演講。
談道,大模型的發(fā)展給計算體系結(jié)構(gòu)帶來了功耗墻、內(nèi)存墻和通訊墻等多重挑戰(zhàn)。其中,大模型訓(xùn)練層面,用戶在模型裝載、模型并行、通信等環(huán)節(jié)面臨各種現(xiàn)實問題;在大模型推理層面,用戶在顯存、帶寬、量化上面臨性能瓶頸。
對于如何進一步釋放云上性能?阿里云彈性計算為云上客戶提供了ECS GPU DeepGPU增強工具包,幫助用戶在云上高效地構(gòu)建AI訓(xùn)練和AI推理基礎(chǔ)設(shè)施,從而提高算力利用效率。
目前,阿里云ECS DeepGPU已經(jīng)幫助眾多客戶實現(xiàn)性能的大幅提升。其中,LLM微調(diào)訓(xùn)練場景下性能最高可提升80%,Stable Difussion推理場景下性能最高可提升60%。
以下為的演講實錄:
今天我分享的是關(guān)于AI基礎(chǔ)設(shè)施的演進和挑戰(zhàn)。我講的內(nèi)容分三個部分:第一部分是關(guān)于生成式AI對云基礎(chǔ)設(shè)施的挑戰(zhàn);第二部分是如何進一步壓榨云上GPU資源的性能,保證訓(xùn)練和推
原文鏈接:阿里云:進一步壓榨云上GPU資源,將大模型訓(xùn)推效率最大化丨GenAICon 2024
聯(lián)系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產(chǎn)業(yè)新媒體!智東西專注報道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級。