標簽:視頻生成

Free Video-LLM:高效視頻語言模型實現(xiàn)無需訓練的智能內(nèi)容生成

Free Video-LLM是創(chuàng)新的無需訓練的高效視頻語言模型,基于提示引導的視覺感知技術,實現(xiàn)對視頻內(nèi)容的高效理解。模型用預訓練的圖像LLMs,無需額外訓練即可適...
閱讀原文

Genmo

Genmo是一個專注于人工智能的創(chuàng)意平臺,用戶可以在 Genmo 上創(chuàng)建視頻、動畫、圖像等。該平臺提供了一系列的工具和服務,旨在幫助用戶通過AI技術輕松創(chuàng)作和分...
閱讀原文

VideoPoet

VideoPoet是由谷歌的研究團隊開發(fā)的一種基于大模型的AI視頻生成方案,支持從文本、圖像或視頻輸入中合成高質量的視頻內(nèi)容,并生成匹配的音頻。VideoPoet的核...
閱讀原文

Stable Video 3D (SV3D)

Stable Video 3D(簡稱SV3D)是由Stability AI公司開發(fā)的一項先進的3D技術,能夠從單張圖片生成高質量的新視角視圖和3D網(wǎng)格。該模型在之前發(fā)布的Stable Video...
閱讀原文

AnimateDiff-Lightning

AnimateDiff-Lightning由字節(jié)跳動的研究人員最新推出的一個高質量視頻生成模型,利用了漸進式對抗性擴散蒸餾技術來實現(xiàn)快速的視頻生成。該模型旨在解決現(xiàn)有視...
閱讀原文

VideoGigaGAN

VideoGigaGAN是由Adobe和馬里蘭大學的研究人員提出的一種新型的生成式視頻超分辨率(VSR)模型,最高可將視頻分辨率提升8倍,將模糊的視頻放大為具有豐富細節(jié)...
閱讀原文

CogVideoX

CogVideoX是智譜AI最新推出的開源AI視頻生成模型,與智譜AI的商業(yè)產(chǎn)品“清影”同源。CogVideoX支持英文提示詞,能生成6秒長、每秒8幀、分辨率為720*480的視頻。...
閱讀原文

HumanVid

HumanVid是香港中文大學和上海人工智能實驗室共同推出的高質量數(shù)據(jù)集,專為人類圖像動畫訓練設計。結合了現(xiàn)實世界視頻和合成數(shù)據(jù),通過精心設計的規(guī)則篩選高...
閱讀原文

新壹視頻大模型

新壹視頻大模型是新壹科技推出的AI視頻創(chuàng)作大模型,自研AI算法和深度學習技術,實現(xiàn)從劇本到成品的一鍵式創(chuàng)作。具備劇本生成、情感化語音合成、3D元素創(chuàng)建和...
閱讀原文

Wav2Lip

Wav2Lip是開源的唇形同步工具,支持用戶將音頻文件轉換成與口型同步的視頻,廣泛應用于視頻編輯和游戲開發(fā)等領域。Wav2Lip不僅能夠實現(xiàn)實時口型生成,還支持...
閱讀原文

VideoLLaMB

VideoLLaMB 是一種創(chuàng)新的長視頻理解框架,通過引入記憶橋接層和遞歸記憶令牌來處理視頻數(shù)據(jù),確保在分析時不丟失關鍵視覺信息。模型特別設計用于理解長時間視...
閱讀原文

通義萬相AI視頻

通義萬相AI視頻是阿里推出的一款完全免費的AI視頻生成工具,支持文生視頻和圖生視頻兩種方式,可以根據(jù)用戶提供的文字提示詞或圖片,自動創(chuàng)作出具有影視級畫...
閱讀原文

CogVideoX-5B-I2V

CogVideoX-5B-I2V 是智譜 AI 開源的一款圖生視頻模型,通過一張圖片和文本提示詞生成視頻。模型采用了3D 因果變分自編碼器和專家自適應 LayerNorm 技術,能輸...
閱讀原文

CogVideoX-Fun

CogVideoX-Fun是一個基于CogVideoX結合EasyAnimate修改的AI視頻生成整合包,提供了更自由的生成條件,支持文字生成視頻、圖片生成視頻以及視頻生成視頻。工具...
閱讀原文

豆包AI視頻模型

豆包AI視頻模型是字節(jié)跳動推出的兩款AI視頻生成大模型:PixelDance 和 Seaweed 。PixelDance基于DiT結構,擅長理解復雜指令,生成連貫、多主體交互的視頻片段...
閱讀原文
1234