與Sora同架構(gòu)的Stable Diffusion 3.0 震撼發(fā)布!4 秒視頻生成卻翻車,網(wǎng)友:還是等 Sora 吧!
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:與Sora同架構(gòu)的Stable Diffusion 3.0 震撼發(fā)布!4 秒視頻生成卻翻車,網(wǎng)友:還是等 Sora 吧!
關(guān)鍵字:模型,解讀,圖像,架構(gòu),視頻
文章來源:AI前線
內(nèi)容字?jǐn)?shù):6013字
內(nèi)容摘要:
編譯 | Tina
Stability AI 發(fā)布了 Stable Diffusion 3.0,這款圖像生成 AI 模型再次刷新了人們的認(rèn)知。
這款由 Stability AI 傾力打造的文本變圖模型,可是迄今為止最強(qiáng)大的“黑科技”!無論你想生成多主題的奇幻場(chǎng)景,還是高精度的風(fēng)景寫真,統(tǒng)統(tǒng)不在話下!
Stability AI 強(qiáng)調(diào)了該版本的幾個(gè)亮點(diǎn),其中首要的就是文字渲染能力,他們?cè)谄涔倬W(wǎng)上一連給了三幅含有文字的圖片,不僅文字清晰而且也沒有任何拼寫錯(cuò)誤。Stability AI 的首席執(zhí)行官 Mostaque 也在 X(Twitter)上狂炫帶有文字的圖片:Stable Diffusion 3.0 中改進(jìn)的排版是 Stability AI 在新模型中構(gòu)建的幾個(gè)改進(jìn)的結(jié)果。
Stability AI 的首席執(zhí)行官 Mostaque 說:“這歸功于 Transformer 架構(gòu)和額外的文本編碼器。現(xiàn)在可以實(shí)現(xiàn)完整的句子和一致的風(fēng)格。”
另一個(gè)亮點(diǎn)是“多主題生成”:用一句話,就能描繪出用戶腦中的萬千世界!
Stability AI 舉了一些例子,讓 SD3 根據(jù)一句含有多個(gè)元素的 Promp
原文鏈接:與Sora同架構(gòu)的Stable Diffusion 3.0 震撼發(fā)布!4 秒視頻生成卻翻車,網(wǎng)友:還是等 Sora 吧!
聯(lián)系作者
文章來源:AI前線
作者微信:ai-front
作者簡(jiǎn)介:面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊、一線業(yè)界實(shí)踐案例、搜羅整理業(yè)界技術(shù)分享干貨、AI論文解讀。每周一節(jié)技術(shù)分享公開課,助力你全面擁抱人工智能技術(shù)。