Stable Diffusion 3 正式開源:超強(qiáng)文生圖模型SD3-M登場引領(lǐng)創(chuàng)新潮流

原標(biāo)題:Stable Diffusion 3 正式開源:超強(qiáng)文生圖模型SD3-M登場引領(lǐng)創(chuàng)新潮流
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):2889字
Stability AI正式開源Stable Diffusion 3 Medium
知名的開源大模型平臺(tái)Stability AI于2024年6月12日晚間9點(diǎn)在上宣布,正式開源了Stable Diffusion 3 Medium(SD3-M)模型權(quán)重。這一舉措為廣大用戶提供了一個(gè)免費(fèi)試用的機(jī)會(huì),官方表示SD3-M是Stable Diffusion 3系列中最新、最先進(jìn)的文本轉(zhuǎn)圖像AI模型。
SD3-M的核心特點(diǎn)
Stable Diffusion 3 Medium(SD3-M)代表了文本到圖像領(lǐng)域的前沿開放技術(shù)。該模型設(shè)計(jì)緊湊,能夠高效運(yùn)行于個(gè)人電腦、筆記本電腦以及企業(yè)級(jí)圖形處理單元(GPU)上。其優(yōu)化的大小使其成為文本轉(zhuǎn)圖像應(yīng)用的新一代標(biāo)準(zhǔn)。
用戶可以在非商業(yè)性的開放許可證和面向創(chuàng)作者的低成本許可證下使用這些精心調(diào)整的模型權(quán)重。對(duì)于有大規(guī)模商業(yè)應(yīng)用需求的用戶,Stability AI也提供了詳細(xì)的許可信息。想要體驗(yàn)Stable Diffusion 3模型的魅力,用戶可以通過Stability AI平臺(tái)的API進(jìn)行嘗試。此外,注冊(cè)Stable Assistant后還可以享受三天的免費(fèi)試用,用戶還可以通過Discord加入Stable Artisan社區(qū),進(jìn)一步探索模型的潛力。
卓越的圖像生成能力
SD3是一款擁有20億參數(shù)的強(qiáng)大文生圖模型,以其高效的推理速度和卓越的生成效果而受到廣泛關(guān)注。其顯著特點(diǎn)包括能夠生成具有照片級(jí)真實(shí)感的圖像,細(xì)節(jié)豐富、色彩鮮艷且光照自然。通過采用創(chuàng)新的16通道變分自編碼器(VAE)等技術(shù),該模型顯著提升了圖像質(zhì)量,尤其在手部和面部等細(xì)節(jié)上克服了其他模型常見的不足。
在理解復(fù)雜提示方面,Stable Diffusion 3 Medium表現(xiàn)出色,能夠深入理解空間關(guān)系、構(gòu)圖元素、動(dòng)作和風(fēng)格等復(fù)雜概念。用戶可以根據(jù)需求選擇一個(gè)或多個(gè)文本編碼器,以平衡生成過程中的性能和效率。排版質(zhì)量的提升也得益于其獨(dú)特的擴(kuò)散變換器架構(gòu),生成的文本在拼寫、字距、字母形狀和間距方面的錯(cuò)誤大幅減少,提供了前所未有的文本質(zhì)量。
資源效率與微調(diào)能力
SD3-M在資源利用方面表現(xiàn)優(yōu)異,小的顯存占用使其可以在標(biāo)準(zhǔn)消費(fèi)者級(jí)GPU上高效運(yùn)行,而不會(huì)犧牲性能。模型的微調(diào)能力同樣值得稱贊,能夠從有限的數(shù)據(jù)集中學(xué)習(xí)細(xì)微的細(xì)節(jié),使得定制化輸出更加精確和完美。這些特點(diǎn)使得Stable Diffusion 3 Medium成為市場上最具吸引力和實(shí)用性的文本到圖像生成模型之一。
與硬件優(yōu)化的合作
SD3-M還與英偉達(dá)和AMD進(jìn)行了特定硬件的優(yōu)化,針對(duì)RTX GPU、TensorRT、最新CPU以及MI-300X進(jìn)行了優(yōu)化,性能最高可提升50%。該模型使用了包含10億張圖片的公開和合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,并針對(duì)特定藝術(shù)風(fēng)格和領(lǐng)域,使用了3000萬張圖片進(jìn)行微調(diào)以及300萬張偏好圖片,使其對(duì)用戶文本提示的理解和嵌入圖片文字的效果更為優(yōu)秀。
無限的探索可能性
通過在線演示,SD3-M生成的效果令人驚艷,能夠生成高聳的摩天大樓、寧靜的海灘景色、熱帶雨林以及20世紀(jì)50年代的老式餐廳等各種圖像。免費(fèi)在線試用為用戶提供了無限的探索可能。
注意事項(xiàng)
需要注意的是,目前SD3-M僅限于學(xué)術(shù)研究,無法進(jìn)行商業(yè)化應(yīng)用。如有商業(yè)需求,用戶需要聯(lián)系Stability AI進(jìn)行商業(yè)授權(quán)。
總結(jié)
Stable Diffusion 3的開源和免費(fèi)試用為用戶探索不同領(lǐng)域應(yīng)用潛力提供了機(jī)會(huì),有望為人工智能領(lǐng)域的發(fā)展帶來更多的可能性和機(jī)遇。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動(dòng)態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點(diǎn)和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。

粵公網(wǎng)安備 44011502001135號(hào)