<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        圖森未來推出的圖生視頻大模型

        AI工具7個(gè)月前發(fā)布 AI工具集
        467 0 0

        產(chǎn)品名稱:Ruyi
        產(chǎn)品簡介:Ruyi是圖森未來科技有限公司推出的圖生視頻大模型,專為在消費(fèi)級顯卡上運(yùn)行設(shè)計(jì),支持多分辨率、多時(shí)長視頻生成,具備首幀、首尾幀控制、幅度控制和鏡頭控制等特性。Ruyi基于DiT架構(gòu),由Casual VAE模塊和Diffusion Transformer組成,用在視頻數(shù)據(jù)壓縮和生成。
        詳細(xì)介紹:

        Ruyi是什么

        Ruyi是圖森未來推出的圖生視頻大模型,專為在消費(fèi)級顯卡上運(yùn)行設(shè)計(jì),支持多分辨率、多時(shí)長視頻生成,具備首幀、首尾幀控制、幅度控制和鏡頭控制等特性。Ruyi基于DiT架構(gòu),由Casual VAE模塊和Diffusion Transformer組成,用在視頻數(shù)據(jù)壓縮和生成。Ruyi能降低動(dòng)漫和游戲內(nèi)容的開發(fā)周期和成本,是ACG愛好者和創(chuàng)作者的理想工具。目前圖森未來將Ruyi-Mini-7B版本正式開源。

        圖森未來推出的圖生視頻大模型

        Ruyi的主要功能

        • 多分辨率、多時(shí)長生成:Ruyi支持從最小384×384到最大1024×1024分辨率的視頻生成,能處理任意長寬比,最長生成120幀/5秒的視頻。
        • 首幀、首尾幀控制生成:基于最多5個(gè)起始幀和最多5個(gè)結(jié)束幀生成視頻,用循環(huán)疊加生成任意長度的視頻。
        • 幅度控制:提供4檔幅度控制,方便用戶對整體畫面的變化程度進(jìn)行控制。
        • 鏡頭控制:提供了上、下、左、右、靜止共5種鏡頭控制,增加視頻生成的靈活性。

        Ruyi的技術(shù)原理

        • 模型架構(gòu):Ruyi基于DiT(Diffusion Model with Transformers)架構(gòu),由兩部分組成:
          • Casual VAE模塊:負(fù)責(zé)視頻數(shù)據(jù)的壓縮和解壓。
          • Diffusion Transformer:負(fù)責(zé)壓縮后的視頻生成。
        • 壓縮與編碼:Casual VAE模塊將空間分辨率壓縮至1/8,時(shí)間分辨率壓縮至1/4,壓縮后每個(gè)像素由16位的BF16進(jìn)行表示。
        • 位置編碼:DiT部分用3D full attention,在空間上使用2D RoPE(Rotary Positional Encoding)進(jìn)行位置編碼,時(shí)間上用sin_cos進(jìn)行位置編碼。
        • 訓(xùn)練損失函數(shù):最終的loss選用DDPM(Denoising Diffusion Probabilistic Models)進(jìn)行訓(xùn)練。
        • 參數(shù)量與訓(xùn)練數(shù)據(jù):模型的總參數(shù)量約為7.1B,用約200M視頻片段進(jìn)行訓(xùn)練。
        • 訓(xùn)練階段:整個(gè)訓(xùn)練分為四個(gè)階段,從低分辨率預(yù)訓(xùn)練到高分辨率微調(diào),逐步提升模型性能。

        Ruyi的項(xiàng)目地址

        Ruyi的應(yīng)用場景

        • 動(dòng)畫預(yù)制:快速生成動(dòng)畫角色和場景的動(dòng)態(tài)演示,評估動(dòng)畫設(shè)計(jì)和故事流程。
        • 游戲CG生成:在游戲開發(fā)中,自動(dòng)生成游戲宣傳視頻或游戲內(nèi)的動(dòng)態(tài)背景。
        • 電影特效預(yù)覽:在電影制作中,幫助導(dǎo)演和特效團(tuán)隊(duì)預(yù)覽特效場景,優(yōu)化后期特效制作。
        • 虛擬主播:生成虛擬主播的動(dòng)態(tài)視頻,用于直播、新聞播報(bào)或在線教育。
        • 社交媒體內(nèi)容:為社交媒體平臺創(chuàng)建吸引人的動(dòng)態(tài)視頻內(nèi)容,提高用戶參與度和品牌曝光。
        閱讀原文
        ? 版權(quán)聲明
        蟬鏡AI數(shù)字人

        相關(guān)文章

        蟬鏡AI數(shù)字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 中文字幕在线免费观看视频| 日韩免费无码一区二区三区| 国产免费区在线观看十分钟| 国内精品一级毛片免费看| 久久www免费人成精品香蕉| 国产精品九九久久免费视频| A片在线免费观看| 韩国欧洲一级毛片免费| 亚洲国产成人精品无码区在线观看 | 亚洲国产一区二区a毛片| 亚洲熟伦熟女专区hd高清| 丰满妇女做a级毛片免费观看| aa级女人大片喷水视频免费| 7723日本高清完整版免费| 亚洲女同成人AⅤ人片在线观看| 亚洲成年人电影网站| 青青草97国产精品免费观看 | 巨胸喷奶水www永久免费| 妞干网在线免费观看| 亚洲国产一区二区视频网站| 亚洲一级大黄大色毛片| 无码专区AAAAAA免费视频| 国产成人99久久亚洲综合精品| 亚洲人成小说网站色| 女同免费毛片在线播放| 亚洲国产av无码精品| 国产精品亚洲专区一区| 在线a毛片免费视频观看| 久久精品国产亚洲AV麻豆网站| 51午夜精品免费视频| 国产成人毛片亚洲精品| 色多多A级毛片免费看| 亚洲国产天堂久久综合| selaoban在线视频免费精品| 亚洲美女高清一区二区三区 | 69影院毛片免费观看视频在线| 亚洲免费一区二区| 99久久成人国产精品免费| 日韩亚洲一区二区三区| 色se01短视频永久免费| 亚洲国产视频一区|