地平線(xiàn)/智源/字節(jié)/凌川科技齊聚上海,共探編譯器優(yōu)化新進(jìn)展
2024 Meet AI Compiler 第 6 期技術(shù)沙龍將于 12 月 28 日在上海五角場(chǎng)創(chuàng)新創(chuàng)業(yè)學(xué)院舉辦。2023 年,HyperAI超神經(jīng)在北京、上海、深圳舉辦了 4 場(chǎng) Meet TVM 線(xiàn)下聚會(huì),聚集了超 1 千位資深從業(yè)者及愛(ài)好者,逐步建立了豐富的社區(qū)生態(tài)。2024 年,HyperAI超神經(jīng)聚焦 AI 編譯器領(lǐng)域,繼續(xù)為業(yè)內(nèi)人士提供開(kāi)放的交流平臺(tái),在今年 7 月舉辦了 Meet AI Compiler 技術(shù)沙龍的第 5 期。如今,2024 年接近尾聲,大模型賽道激戰(zhàn)未停,AI 編譯器有哪些新突破、新應(yīng)用?12 月 28 日,HyperAI超神經(jīng)將在上海五角場(chǎng)舉辦第 6 期 Meet AI Compiler 技術(shù)沙龍,本次活動(dòng)分為技術(shù)分享和圓桌討論 2 個(gè)環(huán)節(jié)。首先,我們有幸邀請(qǐng)到了來(lái)自地平線(xiàn)、北京智源人工智能研究院、字節(jié)跳動(dòng)、凌川科技的 4 位資深專(zhuān)家,為大家分享他們的應(yīng)用案例與行業(yè)觀察。此外,上海交通大學(xué)博士、Apache TVM PMC 馮思遠(yuǎn)將擔(dān)任圓桌環(huán)節(jié)的主持,從專(zhuān)業(yè)的技術(shù)角度,和嘉賓們進(jìn)行思維的碰撞。我們還為大家準(zhǔn)備了精美禮品與茶歇,報(bào)名活動(dòng)并關(guān)注「HyperAI超神經(jīng)」公眾號(hào),后臺(tái)回復(fù)「1228上海」即可參與抽獎(jiǎng),獎(jiǎng)品需在 12 月 28 日當(dāng)天活動(dòng)現(xiàn)場(chǎng)線(xiàn)下領(lǐng)取哦,快來(lái)參與吧~活動(dòng)詳情?時(shí)間:12 月 28 日(周六)13:30-17:45?地點(diǎn):上海五角場(chǎng)創(chuàng)新創(chuàng)業(yè)學(xué)院 2F 報(bào)告廳(楊浦區(qū)大學(xué)路 322 號(hào))?人數(shù):200(現(xiàn)場(chǎng)座位有限,請(qǐng)盡早報(bào)名)??報(bào)名:點(diǎn)擊下方小程序報(bào)名掃碼備注「AI 編譯器」加入活動(dòng)群:? 議程:嘉賓及議程環(huán)節(jié) 1分享嘉賓13:40-14:20李建軍地平線(xiàn)編譯器研發(fā)負(fù)責(zé)人分享主題:Transformer 模型的編譯 & 部署優(yōu)化實(shí)踐內(nèi)容簡(jiǎn)介:Transformer 模型近年來(lái)不僅在 LLM 領(lǐng)域取得了顯著的成果,也在計(jì)算機(jī)視覺(jué)領(lǐng)域得到了廣泛的應(yīng)用。在自動(dòng)駕駛場(chǎng)景中,Transformer 模型的編譯和部署優(yōu)化是一個(gè)復(fù)雜的過(guò)程,端到端模型、VLM 都對(duì)端側(cè)的編譯優(yōu)化和部署提出了非常大的挑戰(zhàn)。本次分享主要介紹地平線(xiàn)在這方面的一些實(shí)踐和經(jīng)驗(yàn)。觀看本場(chǎng)分享,你將了解:1.視覺(jué) Transformer 模型編譯優(yōu)化和部署面臨的挑戰(zhàn)2.地平線(xiàn)在 Transformer 模型編譯優(yōu)化上的探索和實(shí)踐14:20-15:00李之昕北京智源人工智能研究院AI 編譯器研發(fā)工程師分享主題:FlagGems:研發(fā)進(jìn)展與生態(tài)應(yīng)用探索內(nèi)容簡(jiǎn)介:自 2.0 版本發(fā)布以來(lái),在智源團(tuán)隊(duì)、合作廠商及 Triton 中國(guó)社區(qū)的緊密協(xié)作下,F(xiàn)lagGems 在算子支持?jǐn)?shù)量、計(jì)算性能、代碼生成以及運(yùn)行時(shí)機(jī)制等方面取得了顯著的研發(fā)突破。同時(shí),F(xiàn)lagGems 貫通領(lǐng)域上下游,在大模型訓(xùn)練與推理適配、多后端芯片集成等方面展開(kāi)了創(chuàng)新探索,進(jìn)一步拓展了算子庫(kù)在多元生態(tài)中的應(yīng)用場(chǎng)景。觀看本場(chǎng)分享,你將了解:1. FlagGems 的最新研發(fā)成果和技術(shù)提升2. 算子庫(kù)與大模型適配的創(chuàng)新實(shí)踐與經(jīng)驗(yàn)3. 多后端芯片集成的技術(shù)方案與應(yīng)用效果4. Triton 中國(guó)社區(qū)與多元生態(tài)建設(shè)進(jìn)展15:15-15:55鄭思澤字節(jié)跳動(dòng)TopSeedResearch Scientist分享主題:從計(jì)算-訪存-通信優(yōu)化看 AI 編譯器設(shè)計(jì)內(nèi)容簡(jiǎn)介:面向 AI 芯片的編譯優(yōu)化需面臨 3 個(gè)角度的優(yōu)化挑戰(zhàn):計(jì)算、訪存、通信。本報(bào)告將分享 3 個(gè)方面的 AI 編譯器設(shè)計(jì)與優(yōu)化經(jīng)驗(yàn)。計(jì)算角度,分享針對(duì)定制化加速單元的優(yōu)化;訪存角度,分享針對(duì) AI 芯片的訪存建模和優(yōu)化;通信角度,分享計(jì)算通信融合的經(jīng)驗(yàn)和進(jìn)展。觀眾觀看本場(chǎng)分享,你將了解:1.AI 編譯器優(yōu)化的全局視角2.了解充分發(fā)揮 AI 芯片算力的經(jīng)驗(yàn)技巧3.了解未來(lái)分布式 AI 編譯器發(fā)展方向15:55-16:35湯旭濤凌川科技AI Compiler 架構(gòu)師分享主題:基于多核架構(gòu) NPU 的大模型編譯優(yōu)化與推理加速實(shí)踐內(nèi)容簡(jiǎn)介:本次分享聚焦于多核架構(gòu) NPU 在大模型編譯優(yōu)化與推理加速中的實(shí)踐探索。通過(guò)分析 Transformer 等大模型的計(jì)算特性,提出基于 tiling 策略的矩陣優(yōu)化、數(shù)據(jù)并行與模型并行的調(diào)度機(jī)制,以及融合算子與流水線(xiàn)化設(shè)計(jì)的高效推理方法。結(jié)合多核架構(gòu)的并行特性,優(yōu)化了算子分解、內(nèi)存管理,大幅提升推理吞吐量與資源利用率。觀看本場(chǎng)分享,你將了解:1. 云端大模型推理芯片的架構(gòu)2. Transformer 架構(gòu)下 Attention 超級(jí)算子的優(yōu)化策略環(huán)節(jié) 2圓桌討論圓桌主題:芯片-網(wǎng)絡(luò)-軟件-算法-生態(tài)的協(xié)同發(fā)展主辦方及合作伙伴HyperAI超神經(jīng)是國(guó)內(nèi)領(lǐng)先的人工智能及高性能計(jì)算社區(qū),旨在通過(guò)提供數(shù)據(jù)集加速下載、在線(xiàn)教程演示、論文深度解讀、頂會(huì)日歷集成等多種基礎(chǔ)設(shè)施,助力中國(guó)的數(shù)據(jù)科學(xué)與??智能?業(yè)的開(kāi)發(fā)者、愛(ài)好者學(xué)習(xí)、理解、實(shí)踐,與社區(qū)?起構(gòu)建??智能的未來(lái)。目前超神經(jīng)官網(wǎng)已經(jīng)上線(xiàn)數(shù)千個(gè)經(jīng)典及優(yōu)質(zhì)公開(kāi)數(shù)據(jù)集和教程,并運(yùn)營(yíng)國(guó)內(nèi)最活躍的 AI 編譯器社區(qū)。訪問(wèn)官網(wǎng):https://hyper.ai/OpenBayes貝式計(jì)算是國(guó)內(nèi)領(lǐng)先的高性能計(jì)算服務(wù)提供商,通過(guò)為新一代異構(gòu)芯片嫁接經(jīng)典軟件生態(tài)及機(jī)器學(xué)習(xí)模型,進(jìn)而為工業(yè)企業(yè)及高校科研提供更加快速、易用的數(shù)據(jù)科學(xué)計(jì)算產(chǎn)品,其產(chǎn)品已被數(shù)十家大型工業(yè)場(chǎng)景或頭部科研院所所采用。訪問(wèn)官網(wǎng):https://openbayes.com/MLC.AI 社區(qū)成立于 2022 年 6 月,并由 Apache TVM 主要發(fā)明者、機(jī)器學(xué)習(xí)領(lǐng)域著名的青年學(xué)者陳天奇,帶領(lǐng)團(tuán)隊(duì)上線(xiàn)了 MLC 線(xiàn)上課程,系統(tǒng)介紹了機(jī)器學(xué)習(xí)編譯的關(guān)鍵元素以及核心概念。2022 年 11 月,在 MLC.AI 社區(qū)志愿者的共同努力下,首個(gè)完整的 TVM 中文文檔上線(xiàn),并成功托管至 HyperAI超神經(jīng)官網(wǎng),進(jìn)一步為對(duì)機(jī)器學(xué)習(xí)編譯感興趣的國(guó)內(nèi)開(kāi)發(fā)者,提供了接觸并學(xué)習(xí)一門(mén)新技術(shù)的基礎(chǔ)設(shè)置——文檔。MLC 線(xiàn)上課程:https://mlc.ai/TVM 中文文檔:https://tvm.hyper.ai/上海五角場(chǎng)創(chuàng)新創(chuàng)業(yè)學(xué)院是楊浦區(qū)聯(lián)合著名高校及行業(yè)龍頭企業(yè)、創(chuàng)服機(jī)構(gòu)共同發(fā)起設(shè)立的非營(yíng)利性教育及服務(wù)組織。以「創(chuàng)造深度連接,讓創(chuàng)新創(chuàng)業(yè)更容易成功」為使命,連接創(chuàng)業(yè)者和賦能方、提高雙創(chuàng)要素資源的配置效率,促進(jìn)創(chuàng)造發(fā)生。五角場(chǎng)創(chuàng)院 2022 年 11 月,正式啟用學(xué)院公共空間,將 800 平米的空間開(kāi)放共享給雙創(chuàng)人群,并聯(lián)合港中大上海中心、瑞安集團(tuán)等伙伴共同發(fā)起雙創(chuàng)公益品牌「學(xué)院咖啡」,并邀請(qǐng)對(duì)雙創(chuàng)公益服務(wù)有的 KOL、企業(yè)和社會(huì)組織,成為「公益合伙人」,共同設(shè)計(jì)不同形式的創(chuàng)業(yè)者聚集方式,截止目前「學(xué)院咖啡」共舉辦 140+ 場(chǎng)不同形式的雙創(chuàng)主題活動(dòng),匯聚 3000+ 位參與者。活動(dòng)支持活動(dòng)行:掃碼跳轉(zhuǎn)至活動(dòng)行報(bào)名掃碼備注「AI 編譯器」加入活動(dòng)群考慮到本場(chǎng)活動(dòng)的場(chǎng)地空間情況,我們僅開(kāi)放了 200 個(gè)到場(chǎng)名額,建議大家盡早報(bào)名鎖定席位。12 月 28 日 13:30-17:45,期待與大家在上海相聚!最后,推薦一個(gè)學(xué)術(shù)活動(dòng)!點(diǎn)擊圖片了解活動(dòng)詳情 ↓往期推薦戳“閱讀原文”,即可報(bào)名!

粵公網(wǎng)安備 44011502001135號(hào)