<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        Step-Video-T2V

        AI工具5個月前更新 AI工具集
        443 0 0

        Step-Video-T2V – 階躍星辰開源的文本到視頻模型

        Step-Video-T2V 是由階躍星辰團隊開發(fā)的開源文本到視頻生成預訓練模型,具備 300 億參數(shù),能夠生成高達 204 幀的高質(zhì)量視頻。此模型基于深度壓縮的變分自編碼器(Video-VAE),實現(xiàn)了 16×16 的空間壓縮和 8× 的時間壓縮,顯著提高了訓練與推理的效率。

        Step-Video-T2V是什么

        Step-Video-T2V 是一款由階躍星辰團隊推出的開源文本到視頻生成的預訓練模型。它擁有 300 億個參數(shù),能夠生成長達 204 幀的高質(zhì)量視頻。該模型采用了深度壓縮的變分自編碼器(Video-VAE)架構(gòu),能夠?qū)崿F(xiàn) 16×16 的空間壓縮和 8× 的時間壓縮,從而大幅提升了訓練和推理的效率。此外,Step-Video-T2V 配備了雙語文本編碼器,支持中英文提示輸入,并通過直接偏好優(yōu)化(DPO)方法進一步提升視頻生成的質(zhì)量。該模型基于擴散的 Transformer(DiT)架構(gòu)和 3D 全注意力機制,在生成具有豐富動態(tài)和高美學質(zhì)量的視頻方面表現(xiàn)尤為突出。

        Step-Video-T2V

        Step-Video-T2V的主要功能

        • 高質(zhì)量視頻生成:Step-Video-T2V 具備 300 億參數(shù),能夠生成長達 204 幀的高質(zhì)量視頻,支持 544×992 的分辨率。
        • 雙語文本支持:內(nèi)置雙語文本編碼器,能直接處理中文和英文提示,生成與文本描述一致的視頻內(nèi)容。
        • 動態(tài)與美學優(yōu)化:采用 3D 全注意力的 DiT 架構(gòu)和 Flow Matching 訓練方法,生成具有強烈效果和卓越美學的視頻。

        Step-Video-T2V的技術原理

        • 深度壓縮的變分自編碼器(Video-VAE):Step-Video-T2V 采用深度壓縮的變分自編碼器(Video-VAE),實現(xiàn) 16×16 的空間壓縮和 8× 的時間壓縮,有效降低了視頻生成任務的計算復雜度,同時保持了出色的視頻重建質(zhì)量。
        • 雙語文本編碼器:模型配備兩個預訓練的雙語文本編碼器,能夠理解中文和英文提示,從而生成符合文本描述的視頻。
        • 基于擴散的 Transformer(DiT)架構(gòu):Step-Video-T2V 基于擴散的 Transformer(DiT)架構(gòu),結(jié)合 3D 全注意力機制,通過 Flow Matching 訓練逐步去噪輸入噪聲,生成潛在幀,利用文本嵌入和時間步作為條件因子,展現(xiàn)出色的動態(tài)和美學質(zhì)量。
        • 直接偏好優(yōu)化(DPO):為提升生成視頻品質(zhì),Step-Video-T2V 引入視頻直接偏好優(yōu)化(Video-DPO)方法,利用人類偏好數(shù)據(jù)對模型進行微調(diào),降低偽影并增強視覺效果,使生成的視頻更加流暢和真實。
        • 級聯(lián)訓練策略:模型采用級聯(lián)訓練流程,包括文本到圖像(T2I)預訓練、文本到視頻/圖像(T2VI)預訓練、文本到視頻(T2V)微調(diào)及直接偏好優(yōu)化(DPO)訓練,促進模型快速收斂,充分利用不同質(zhì)量的視頻數(shù)據(jù)。
        • 系統(tǒng)優(yōu)化:在系統(tǒng)層面,Step-Video-T2V 進行了優(yōu)化,包括張量并行、序列并行和 Zero1 優(yōu)化,確保高效的分布式訓練。引入高性能通信框架 StepRPC 和雙層監(jiān)控系統(tǒng) StepTelemetry,以優(yōu)化數(shù)據(jù)傳輸效率和識別性能瓶頸。

        Step-Video-T2V的項目地址

        Step-Video-T2V的應用場景

        • 視頻內(nèi)容創(chuàng)作:Step-Video-T2V 可根據(jù)文本提示快速生成創(chuàng)意視頻,幫助創(chuàng)作者節(jié)省時間和精力,降低視頻制作的門檻。
        • 廣告制作:能夠為品牌和廣告商生成個性化的視頻廣告內(nèi)容,提升廣告的吸引力和傳播效果。
        • 教育與培訓:可生成教學視頻,幫助學生更好地理解和記憶知識內(nèi)容。
        • 娛樂與影視:為影視制作提供創(chuàng)意素材,輔助生成特效、動畫或短劇片段,加速創(chuàng)作流程。
        • 社交媒體:Step-Video-T2V 為用戶提供個性化的視頻生成工具,豐富社交平臺的內(nèi)容生態(tài),提升用戶互動性。生成的視頻可用于社交媒體的創(chuàng)意內(nèi)容分享。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲熟妇av一区二区三区| 国产免费无遮挡精品视频| 亚洲AV第一页国产精品| 成人网站免费大全日韩国产| 亚洲无码一区二区三区| 免费一区二区无码视频在线播放 | 色片在线免费观看| 内射干少妇亚洲69XXX| 91精品免费观看| 亚洲videosbestsex日本| 午夜宅男在线永久免费观看网| 亚洲一级毛片视频| 日韩一级在线播放免费观看| 亚洲综合国产精品第一页| 精品97国产免费人成视频 | 国产成人精品无码免费看| 日韩免费精品视频| 亚洲熟女综合一区二区三区| 麻豆国产入口在线观看免费| 国产亚洲精品免费| 在线免费视频一区| 亚洲综合色丁香麻豆| 久草免费福利在线| 亚洲日本精品一区二区| 香蕉视频免费在线播放| 久久WWW免费人成人片| 亚洲AV无码精品无码麻豆| 99国产精品永久免费视频| 爱爱帝国亚洲一区二区三区| 亚洲一区精品伊人久久伊人 | 亚洲国产高清视频在线观看| 国产精品成人免费一区二区| 免费无码又爽又黄又刺激网站| 亚洲精品中文字幕无码蜜桃| 成人免费视频网站www| 麻豆va在线精品免费播放| 久久久亚洲欧洲日产国码农村| 午夜视频在线观看免费完整版| 中文字幕在线视频免费| 久久久久精品国产亚洲AV无码| 亚洲精品无码永久在线观看 |