AIGC動態歡迎閱讀
原標題:基于DiT,支持4K圖像生成,華為諾亞0.6B文生圖模型PixArt-Σ來了
關鍵字:模型,圖像,華為,團隊,文本
文章來源:機器之心
內容字數:6659字
內容摘要:
機器之心報道
機器之心編輯部這個模型和 Sora 一樣采用了 DiT 框架。眾所周知,開發頂級的文生圖(T2I)模型需要大量資源,因此資源有限的個人研究者基本都不可能承擔得起,這也成為了 AIGC(人工智能內容生成)社區創新的一大阻礙。同時隨著時間的推移,AIGC 社區又能獲得持續更新的、更高質量的數據集和更先進的算法。
于是關鍵的問題來了:我們能以怎樣的方式將這些新元素高效地整合進現有模型,依托有限的資源讓模型變得更強大?
為了探索這個問題,華為諾亞方舟實驗室等研究機構的一個研究團隊提出一種新的訓練方法:由弱到強式訓練(weak-to-strong training)。論文標題:PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
論文地址:https://arxiv.org/pdf/2403.04692.pdf
項目頁面:https://pixart-alpha.github.io/PixArt-sigma-project/
他們的研究基于他們去年十月提出
原文鏈接:基于DiT,支持4K圖像生成,華為諾亞0.6B文生圖模型PixArt-Σ來了
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...