萬字綜述：全面梳理 FP8 訓(xùn)練和推理技術(shù)

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布智猩猩AGI

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：萬字綜述：全面梳理 FP8 訓(xùn)練和推理技術(shù)
關(guān)鍵字：精度,作者,模型,表示,尾數(shù)
文章來源：智猩猩AGI
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

大模型時(shí)代最火AI芯片峰會(huì)來啦！！9月6-7日，由智猩猩聯(lián)合主辦的2024全球AI芯片峰會(huì)將在北京舉行。峰會(huì)設(shè)有數(shù)據(jù)中心AI芯片、智算集群技術(shù)論壇等7大板塊。目前，清華大學(xué)教授、集成電路學(xué)院副院長(zhǎng)尹首一，AMD人工智能事業(yè)部高級(jí)總監(jiān)王宏強(qiáng)，高通AI產(chǎn)品技術(shù)中國(guó)區(qū)負(fù)責(zé)人萬衛(wèi)星，摩爾線程高級(jí)產(chǎn)品總監(jiān)付海良波等30+位嘉賓已確認(rèn)參會(huì)。掃名～01背景隨著 ChatGPT 的橫空出世，LLM/AIGC 領(lǐng)域迎來空前的關(guān)注，各類大模型如雨后春筍般出現(xiàn)，科技公司對(duì) AI 算力的需求也呈爆發(fā)式增長(zhǎng)。在這樣的背景下，如何在有限資源內(nèi)提升模型訓(xùn)練和推理效率成為研究的熱點(diǎn)。而在眾多的方向中
FP8 逐漸成為研究熱點(diǎn)，F(xiàn)P8 的應(yīng)用落地也是一個(gè)極具潛力的方向。
FP8 的重要性日益凸顯，很大程度上得益于 NVIDIA Hopper 架構(gòu)和 Ada Lovelace 架構(gòu)對(duì) FP8 的硬件支持。最新發(fā)布的 Blackwell 架構(gòu)更是進(jìn)一步拓展了低精度范圍，支持了 FP6 和 FP4 格式。
業(yè)界對(duì) FP8 的支持也在不斷深入，我們也一直在關(guān)注業(yè)內(nèi)對(duì) FP8 的支持情況。比如各種推理框架（如 vLLM、T

原文鏈接：萬字綜述：全面梳理 FP8 訓(xùn)練和推理技術(shù)