與Sora同架構的Stable Diffusion 3.0 震撼發布！4 秒視頻生成卻翻車，網友：還是等 Sora 吧！

AIGC動態2年前 (2024)發布 AI前線

AIGC動態歡迎閱讀

原標題：與Sora同架構的Stable Diffusion 3.0 震撼發布！4 秒視頻生成卻翻車，網友：還是等 Sora 吧！
關鍵字：模型,解讀,圖像,架構,視頻
文章來源：AI前線
內容字數：6013字

內容摘要：

編譯 | Tina
Stability AI 發布了 Stable Diffusion 3.0，這款圖像生成 AI 模型再次刷新了人們的認知。
這款由 Stability AI 傾力打造的文本變圖模型，可是迄今為止最強大的“黑科技”！無論你想生成多主題的奇幻場景，還是高精度的風景寫真，統統不在話下！
Stability AI 強調了該版本的幾個亮點，其中首要的就是文字渲染能力，他們在其官網上一連給了三幅含有文字的圖片，不僅文字清晰而且也沒有任何拼寫錯誤。Stability AI 的首席執行官 Mostaque 也在 X（Twitter）上狂炫帶有文字的圖片：Stable Diffusion 3.0 中改進的排版是 Stability AI 在新模型中構建的幾個改進的結果。
Stability AI 的首席執行官 Mostaque 說：“這歸功于 Transformer 架構和額外的文本編碼器。現在可以實現完整的句子和一致的風格。”
另一個亮點是“多主題生成”：用一句話，就能描繪出用戶腦中的萬千世界！
Stability AI 舉了一些例子，讓 SD3 根據一句含有多個元素的 Promp

原文鏈接：與Sora同架構的Stable Diffusion 3.0 震撼發布！4 秒視頻生成卻翻車，網友：還是等 Sora 吧！