AI項目和框架
InternVideo2.5
InternVideo2.5是上海人工智能實驗室聯合南京大學、中科院深圳先進技術研究院共同開源的視頻多模態大模型。在視頻理解領域取得了顯著進展,特別是在長視頻處...
VideoCaptioner
VideoCaptioner(中文名:卡卡字幕助手)是基于大語言模型(LLM)的智能字幕處理工具,能簡化視頻字幕的生成與優化流程。VideoCaptioner支持語音識別、字幕斷...
Zonos-v0.1
Zonos-v0.1是Zyphra推出的高保真文本到語音(TTS)模型。Zonos-v0.1包含兩個模型:16億參數的Transformer模型和SSM混合模型,均在Apache 2.0許可下開源。Zono...
InspireMusic
InspireMusic 是阿里巴巴通義實驗室開源的音樂生成技術,通過人工智能為用戶生成高質量的音樂作品。基于多模態大模型技術,支持通過簡單的文字描述或音頻提示...
MotionCanvas
MotionCanvas是香港中文大學、Adobe 研究院和莫納什大學推出的圖像到視頻(I2V)生成方法,能將靜態圖像轉化為具有豐富動態效果的視頻。MotionCanvas基于引入...
VisoMaster
VisoMaster 是基于 AI 技術的換臉和編輯軟件,功能強大操作簡便。支持圖片、視頻以及直播換臉,能生成自然逼真的換臉效果,應用于娛樂、影視制作等領域。支持...