AIGC動態歡迎閱讀
原標題:Stable Diffusion 3開源秒翻車,畫人好掉san
關鍵字:模型,翻車,版本,發現,問題
文章來源:量子位
內容字數:0字
內容摘要:
明敏 發自 凹非寺量子位 | 公眾號 QbitAI沒想到……Stable Diffusion 3開源即出現翻車案例。
生成一個躺在草地上的女孩,結果長這樣?
而且不是個例,只要是和人(整體)相關的內容,生成結果都有點掉san。
(前方高能)
但如果是局部,比如只生臉,確實很nice。
清晰度、寫字、寫實性等方面都有明顯提升。
對于復雜長提示詞的理解也很到位,有網友發現提示越長它畫的越好。
那么問題來了,為啥偏偏畫不好人類?
問題可能在于數據集先來看看SD3開源的具體情況。
本次開源的版本是Stable Diffusion 3 Medium(中杯)。
它的規模為20億參數,在筆記本上就能跑了。
官方強調的屬性有5方面,逐一來看:
整體質量和寫實性
可生成出色的細節,包括色彩、光線、強寫實等,帶來靈活風格的高質量輸出。
通過16通道VAE,成功解決了其他模型的常見缺陷,比如手部和面部的寫實問題。
提示詞理解
可以理解復雜長提示,包含空間推理、元素組合、動作、風格等。3個文本編碼器可以全部或者組合使用,方便用戶平衡性能和顯存。
有效利用資源
對VRAM占用很低,非常適合在消費級GPU上運
原文鏈接:Stable Diffusion 3開源秒翻車,畫人好掉san
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...