Stable Diffusion 3論文終于發(fā)布,架構(gòu)細(xì)節(jié)大揭秘,對(duì)復(fù)現(xiàn)Sora有幫助?

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Stable Diffusion 3論文終于發(fā)布,架構(gòu)細(xì)節(jié)大揭秘,對(duì)復(fù)現(xiàn)Sora有幫助?
關(guān)鍵字:模型,文本,圖像,作者,性能
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):5724字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:張倩在眾多前沿成果都不再透露技術(shù)細(xì)節(jié)之際,Stable Diffusion 3 論文的發(fā)布顯得相當(dāng)珍貴。Stable Diffusion 3 的論文終于來(lái)了!
這個(gè)模型于兩周前發(fā)布,采用了與 Sora 相同的 DiT(Diffusion Transformer)架構(gòu),一經(jīng)發(fā)布就引起了不小的轟動(dòng)。
與之前的版本相比,Stable Diffusion 3 生成的圖在質(zhì)量上實(shí)現(xiàn)了很大改進(jìn),支持多主題提示,文字書(shū)寫(xiě)效果也更好了(明顯不再亂碼)。Stability AI 表示,Stable Diffusion 3 是一個(gè)模型系列,參數(shù)量從 800M 到 8B 不等。這個(gè)參數(shù)量意味著,它可以在很多便攜式設(shè)備上直接跑,大大降低了 AI 大模型的使用門(mén)檻。
在最新發(fā)布的論文中,Stability AI 表示,在基于人類(lèi)偏好的評(píng)估中,Stable Diffusion 3 優(yōu)于當(dāng)前最先進(jìn)的文本到圖像生成系統(tǒng),如 DALL?E 3、Midjourney v6 和 Ideogram v1。不久之后,他們將公開(kāi)該研究的實(shí)驗(yàn)數(shù)據(jù)、代碼和模型權(quán)重。在論文中,Stability AI 透露了關(guān)于
原文鏈接:Stable Diffusion 3論文終于發(fā)布,架構(gòu)細(xì)節(jié)大揭秘,對(duì)復(fù)現(xiàn)Sora有幫助?
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)