<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        CogVideoX

        AI工具9個月前發(fā)布 AI工具集
        1,904 0 0

        CogVideoX是什么

        CogVideoX是智譜AI最新發(fā)布的一款開源AI視頻生成模型,它與智譜AI的商業(yè)產(chǎn)品“清影”有著共同的技術(shù)基礎。CogVideoX能夠接受英文提示詞,生成時長為6秒、幀率為每秒8幀、分辨率為720*480的視頻。推理過程中需要的顯存范圍在7.8GB至26GB之間,目前尚不支持量化推理和多卡推理。該項目還包含了3D Causal VAE組件用于視頻重建,配備豐富的示例和工具,包括CLI/WEB演示、在線體驗、API接口示例以及微調(diào)指南。

        CogVideoX

        CogVideoX的主要功能

        • 文本生成視頻:用戶可以通過輸入文本提示,生成相應的視頻內(nèi)容。
        • 顯存需求低:在INT8精度下,推理顯存僅需7.8GB,使用1080 Ti顯卡也能完成推理。
        • 視頻參數(shù)定制:支持用戶自定義視頻的長度、幀率和分辨率,當前版本支持生成6秒長、8幀/秒、720*480分辨率的視頻。
        • 3D Causal VAE技術(shù):通過3D Causal VAE技術(shù),實現(xiàn)視頻內(nèi)容的高效重建。
        • 推理與微調(diào):模型不僅支持基本的推理生成視頻,還提供了微調(diào)功能,以滿足不同需求。

        CogVideoX的技術(shù)原理

        • 文本到視頻生成:CogVideoX利用深度學習模型,特別是基于Transformer的架構(gòu),來解析輸入的文本提示并生成視頻內(nèi)容。
        • 3D Causal VAE:該模型采用了3D Causal Variational Autoencoder(變分自編碼器),這是一種用于視頻重建和壓縮的技術(shù),能夠幾乎無損地重建視頻,降低存儲和計算需求。
        • 專家Transformer:CogVideoX運用了專家Transformer模型,這是一種特殊的Transformer架構(gòu),通過多個專家協(xié)同處理不同的任務,比如空間與時間信息的處理,以及控制信息流動等。
        • 編碼器-解碼器架構(gòu):在3D VAE中,編碼器將視頻轉(zhuǎn)換為簡化的代碼,而解碼器根據(jù)這些代碼重建出視頻,潛在空間正則化器確保編碼和解碼之間的信息傳遞更加準確。
        • 混合時長訓練:CogVideoX采用混合時長訓練法,使模型能夠?qū)W習生成不同長度的視頻,提高其泛化能力。
        • 多階段訓練:訓練過程分為多個階段,包括低分辨率預訓練、高分辨率預訓練及高質(zhì)量視頻微調(diào),逐步提升模型的生成質(zhì)量與細節(jié)。
        • 自動與人工評估:CogVideoX結(jié)合自動評估和人工評估的方式,以確保生成視頻的質(zhì)量符合預期。

        CogVideoX

        CogVideoX的項目地址

        CogVideoX-2B與CogVideoX-5B參數(shù)對比

        CogVideoX

        CogVideoX的性能評估

        為評估文本到視頻生成的質(zhì)量,我們采用了VBench中的多項指標,包括人類動作、場景及動態(tài)程度等。此外,還使用了兩個額外的視頻評估工具:Devil中的動態(tài)質(zhì)量和Chrono-Magic中的GPT4o-MT評分,這些工具專注于視頻的動態(tài)特性,如下表所示。

        CogVideoX

        CogVideoX的應用場景

        • 創(chuàng)意視頻制作:為視頻創(chuàng)作者和藝術(shù)家提供工具,快速將創(chuàng)意文本描述轉(zhuǎn)化為生動的視頻內(nèi)容。
        • 教育與培訓材料:自動生成教育視頻,有助于闡釋復雜概念或展示教學場景。
        • 廣告與品牌宣傳:企業(yè)可以利用CogVideoX模型基于廣告文案生成視頻廣告,提升營銷效果。
        • 游戲與娛樂產(chǎn)業(yè):輔助游戲開發(fā)者快速生成游戲內(nèi)動畫或劇,增強游戲體驗。
        • 電影與視頻編輯:幫助視頻編輯人員通過文本描述生成特定場景或特效視頻。
        • 虛擬現(xiàn)實(VR)與增強現(xiàn)實(AR):為VR和AR應用生成沉浸式視頻內(nèi)容,提升用戶互動體驗。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 77777亚洲午夜久久多喷| 久久青草亚洲AV无码麻豆| 亚洲va久久久久| 在线看免费观看AV深夜影院| 亚洲字幕在线观看| 在线看片v免费观看视频777| 亚洲精品综合在线影院| 日本特黄特黄刺激大片免费| 菠萝菠萝蜜在线免费视频| 亚洲精品成人久久久| 中文字幕永久免费| 久久精品国产亚洲AV麻豆不卡| 无码日韩精品一区二区免费暖暖 | 精品视频在线免费观看| 国产成人精品日本亚洲网站| 日韩免费电影网址| 亚洲国产成AV人天堂无码| 毛片a级三毛片免费播放| 免费人成在线观看播放a| 亚洲日本成本人观看| 性xxxxx大片免费视频| 亚洲乱码中文论理电影| 日日操夜夜操免费视频| 久久久久久久国产免费看| 亚洲Aⅴ无码专区在线观看q| 美女被免费喷白浆视频| 老司机午夜在线视频免费观| 亚洲精品美女久久久久99| 综合在线免费视频| 污视频网站免费观看| 亚洲精品免费观看| 一级成人毛片免费观看| 日韩亚洲Av人人夜夜澡人人爽| 成年女人18级毛片毛片免费观看| 一级毛片试看60分钟免费播放| 久久亚洲精品无码AV红樱桃| 曰皮全部过程视频免费国产30分钟| 久久99精品免费一区二区| 亚洲国产成人综合| 国产亚洲精品成人a v小说| 波多野结衣中文字幕免费视频|