談?wù)剬penAI Triton的一些理解
AIGC動態(tài)歡迎閱讀
原標(biāo)題:談?wù)剬?a class="external" href="http://www.futurefh.com/sites/1800.html" title="OpenAI官網(wǎng)" target="_blank">OpenAI Triton的一些理解
關(guān)鍵字:工作,用戶,知乎,侵權(quán),指令
文章來源:智猩猩GenAI
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
大會預(yù)告12月5日-6日,2024中國生成式AI大會(上海站)舉辦。將邀請50+位嘉賓圍繞大模型、AI Infra、端側(cè)生成式AI、AI視頻生成和具身智能等議題進(jìn)行同臺分享和討論。歡迎報名或購票。導(dǎo)讀作者為楊軍
原文來自知乎,地址:https://zhuanlan.zhihu.com/p/613244988
本文只做學(xué)術(shù)/技術(shù)分享,如有侵權(quán),聯(lián)系刪文。01前言在AI系統(tǒng)領(lǐng)域,Triton其實是個有些歧義的名字,因為至少有兩個足夠有影響力的Triton相關(guān)的AI系統(tǒng)的工作,一個是NVIDIA用于在線服務(wù)布署的Triton Inference Server,另一個是由OpenAI發(fā)起的高層次Kernel開發(fā)語言Triton。
今天討論的是后者。
大約在21年上半年,一個硬件公司的朋友給自己分享過Triton的工作,當(dāng)時并沒有很深刻的映象。第二次關(guān)注是在2022年上半年,因為一些機(jī)緣巧合,又接觸到了Triton相關(guān)的內(nèi)容,彼時Triton基于MLIR重構(gòu)的工作剛剛開始,甚至整個架子都還沒能跑通。正好自己一直在思考基于MLIR解決計算密集算子codegen問題的可能性,也對Triton這種高層
聯(lián)系作者
文章來源:智猩猩GenAI
作者微信:
作者簡介: