深入解讀Transformer擴散模型的先驅(qū)之作:DiT、PixArt、HDiT
AIGC動態(tài)歡迎閱讀
原標(biāo)題:深入解讀Transformer擴散模型的先驅(qū)之作:DiT、PixArt、HDiT
關(guān)鍵字:模型,圖像,知乎,華為,侵權(quán)
文章來源:算法邦
內(nèi)容字?jǐn)?shù):15631字
內(nèi)容摘要:
智猩猩和智東西發(fā)起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應(yīng)用專場;分會場將進行具身智能技術(shù)研討會、AI智能體技術(shù)研討會和中國智算中心創(chuàng)新論壇。掃名,也可咨詢。導(dǎo)讀原文來自知乎,作者為笑書神俠,是美團AI算法工程師,本文主要介紹DIT、PixArt、HDiT三款模型各自的特點和貢獻。
原文鏈接:https://zhuanlan.zhihu.com/p/684953658
本文只做學(xué)術(shù)/技術(shù)分享,如有侵權(quán),聯(lián)系刪文。最近,隨著sora和stable diffusion3等技術(shù)的流行,基于transformer的擴散模型結(jié)構(gòu)受到了大家的廣泛關(guān)注。實際上,在這些技術(shù)火熱之前,就已經(jīng)有一些在這一領(lǐng)域的重要研究成果。其中,像
DiT(https://www.wpeebles.com/DiT.html)
PixArt(https://pixart-alpha.github.io/)
HDiT(https://crowsonkb.github.io/hourglass-diffusion-transformer
原文鏈接:深入解讀Transformer擴散模型的先驅(qū)之作:DiT、PixArt、HDiT
聯(lián)系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,連接AI新青年,講解研究成果,分享系統(tǒng)思考。