標簽:視頻生成
Free Video-LLM:高效視頻語言模型實現(xiàn)無需訓練的智能內(nèi)容生成
Free Video-LLM是創(chuàng)新的無需訓練的高效視頻語言模型,基于提示引導的視覺感知技術,實現(xiàn)對視頻內(nèi)容的高效理解。模型用預訓練的圖像LLMs,無需額外訓練即可適...
Stable Video 3D (SV3D)
Stable Video 3D(簡稱SV3D)是由Stability AI公司開發(fā)的一項先進的3D技術,能夠從單張圖片生成高質量的新視角視圖和3D網(wǎng)格。該模型在之前發(fā)布的Stable Video...
AnimateDiff-Lightning
AnimateDiff-Lightning由字節(jié)跳動的研究人員最新推出的一個高質量視頻生成模型,利用了漸進式對抗性擴散蒸餾技術來實現(xiàn)快速的視頻生成。該模型旨在解決現(xiàn)有視...
VideoGigaGAN
VideoGigaGAN是由Adobe和馬里蘭大學的研究人員提出的一種新型的生成式視頻超分辨率(VSR)模型,最高可將視頻分辨率提升8倍,將模糊的視頻放大為具有豐富細節(jié)...
VideoLLaMB
VideoLLaMB 是一種創(chuàng)新的長視頻理解框架,通過引入記憶橋接層和遞歸記憶令牌來處理視頻數(shù)據(jù),確保在分析時不丟失關鍵視覺信息。模型特別設計用于理解長時間視...
CogVideoX-5B-I2V
CogVideoX-5B-I2V 是智譜 AI 開源的一款圖生視頻模型,通過一張圖片和文本提示詞生成視頻。模型采用了3D 因果變分自編碼器和專家自適應 LayerNorm 技術,能輸...
CogVideoX-Fun
CogVideoX-Fun是一個基于CogVideoX結合EasyAnimate修改的AI視頻生成整合包,提供了更自由的生成條件,支持文字生成視頻、圖片生成視頻以及視頻生成視頻。工具...