<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Stable Diffusion 3技術報告出爐:揭露Sora同款架構細節

        AIGC動態2年前 (2024)發布 量子位
        461 0 0

        Stable Diffusion 3技術報告出爐:揭露Sora同款架構細節

        AIGC動態歡迎閱讀

        原標題:Stable Diffusion 3技術報告出爐:揭露Sora同款架構細節
        關鍵字:報告,騰訊,模型,文本,圖像
        文章來源:量子位
        內容字數:5447字

        內容摘要:


        豐色 發自 凹非寺量子位 | 公眾號 QbitAI很快啊,“文生圖新王”Stable Diffusion 3的技術報告,這就來了。
        全文一共28頁,誠意滿滿。
        “老規矩”,宣傳海報(??)直接用模型生成,再秀一把文字渲染能力:
        所以,SD3這比DALL·E 3和Midjourney v6都要強的文字以及指令跟隨技能,究竟怎么點亮的?
        技術報告揭露:
        全靠多模態擴散Transformer架構MMDiT。
        成功關鍵是對圖像和文本表示使用單獨兩組權重的方式,由此實現了比SD3之前的版本都要強的性能飛升。
        具體幾何,我們翻開報告來看。
        微調DiT,提升文本渲染能力在發布SD3之初,官方就已經透露它的架構和Sora同源,屬于擴散型Transformer——DiT。
        現在答案揭曉:
        由于文生圖模型需要考慮文本和圖像兩種模式,Stability AI比DiT更近一步,提出了新架構MMDiT。
        這里的“MM”就是指“multimodal”。
        和Stable Diffusion此前的版本一樣,官方用兩個預訓練模型來獲得合適和文本和圖像表示。
        其中文本表示的編碼用三種不同的文本嵌入器(embedders)


        原文鏈接:Stable Diffusion 3技術報告出爐:揭露Sora同款架構細節

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲AV午夜福利精品一区二区| 国产高清免费在线| 亚洲AV无码日韩AV无码导航 | 亚洲一卡2卡3卡4卡乱码 在线| 99精品视频在线观看免费播放| 亚洲国产精品特色大片观看完整版| 成人电影在线免费观看| 亚洲AV午夜成人影院老师机影院| 国产精品区免费视频| 久久精品夜色国产亚洲av| 99久久久国产精品免费牛牛四川 | 亚洲AV福利天堂一区二区三 | 永久在线观看免费视频| 久久亚洲一区二区| 99在线观看视频免费| 亚洲无线一二三四区| 免费高清小黄站在线观看| 亚洲欧美日韩久久精品| 中国一级毛片免费看视频| 亚洲精品狼友在线播放| 在线观看的免费网站无遮挡| 亚洲中文无码线在线观看| 成年女人男人免费视频播放| 狠狠热精品免费观看| 亚洲国产精品无码久久久秋霞2 | 国产精品免费观看久久| 日日狠狠久久偷偷色综合免费 | 91免费资源网站入口| 亚洲精品V天堂中文字幕| 亚洲一级特黄大片无码毛片 | 亚洲日本视频在线观看| 成人片黄网站A毛片免费| 一级毛片aaaaaa视频免费看| 亚洲成Av人片乱码色午夜| 皇色在线视频免费网站| 成人在线免费视频| 亚洲高清资源在线观看| 国产成人免费片在线视频观看| 中国毛片免费观看| 国产v亚洲v天堂a无| 亚洲精品自在在线观看|