<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        北大字節開辟圖像生成新范式!超越Sora核心組件DiT,不再預測下一個token

        AIGC動態1年前 (2024)發布 量子位
        417 0 0

        北大字節開辟圖像生成新范式!超越Sora核心組件DiT,不再預測下一個token

        AIGC動態歡迎閱讀

        原標題:北大字節開辟圖像生成新范式!超越Sora核心組件DiT,不再預測下一個token
        關鍵字:字節跳動,模型,圖像,分辨率,峰會
        文章來源:量子位
        內容字數:3953字

        內容摘要:


        魚羊 發自 凹非寺量子位 | 公眾號 QbitAI北大和字節聯手搞了個大的:
        提出圖像生成新范式,從預測下一個token變成預測下一級分辨率,效果超越Sora核心組件Diffusion Transformer(DiT)。
        并且代碼開源,短短幾天已經攬下1.3k標星,登上GitHub趨勢榜。
        具體是個什么效果?
        實驗數據上,這個名為VAR(Visual Autoregressive Modeling)的新方法不僅圖像生成質量超過DiT等傳統SOTA,推理速度也提高了20+倍。
        這也是自回歸模型首次在圖像生成領域擊敗DiT。
        直觀感受上,話不多說,直接看圖:
        值得一提的是,研究人員還在VAR上,觀察到了大語言模型同款的Scaling Laws和零樣本任務泛化。
        論文代碼上線,已經引發不少專業討論。
        有網友表示有被驚到,頓時覺得其他擴散架構的論文有點索然無味。
        還有人認為,這是一種通向Sora的更便宜的潛在途徑,計算成本可降低一個乃至多個數量級。
        預測下一級分辨率簡單來說,VAR的核心創新,就是用預測下一級分辨率,替代了預測下一個token的傳統自回歸方法。
        VAR的訓練分為兩個階段。
        第一


        原文鏈接:北大字節開辟圖像生成新范式!超越Sora核心組件DiT,不再預測下一個token

        聯系作者

        文章來源:量子位
        作者微信:QbitAI
        作者簡介:追蹤人工智能新趨勢,關注科技行業新突破

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产一区视频在线免费观看 | h视频在线免费看| 久久综合图区亚洲综合图区| 亚洲美女中文字幕| 98精品全国免费观看视频| 日韩a级毛片免费视频| 亚洲日韩精品A∨片无码加勒比| 69成人免费视频| 77777亚洲午夜久久多人| 亚洲一级片在线播放| 三年片在线观看免费大全| 国产亚洲情侣一区二区无| 亚洲乱人伦中文字幕无码| 国产精品免费播放| rh男男车车的车车免费网站| 亚洲色大成网站www永久一区| 亚洲精品无码av中文字幕| 国产精品成人69XXX免费视频| 亚洲乱亚洲乱妇无码麻豆| 无码AV片在线观看免费| 亚洲Av无码一区二区二三区| 免费爱爱的视频太爽了| 亚洲天堂福利视频| 日韩特黄特色大片免费视频| 一级成人a免费视频| 亚洲国产一区在线| 日韩一区二区三区免费体验| 国产精品成人啪精品视频免费| 亚洲av中文无码乱人伦在线播放 | 国产午夜成人免费看片无遮挡 | 免费**毛片在线播放直播| 亚洲精品456在线播放| 永久免费无码网站在线观看| 99热这里只有精品6免费| 亚洲AV美女一区二区三区| 99在线免费观看视频| 国产精品亚洲精品| 国产专区一va亚洲v天堂| 在线免费观看你懂的| 国产亚洲av片在线观看16女人| 999久久久免费精品播放|