AI項目和框架
CogView-3-Plus
CogView-3-Plus是智譜AI最新推出的AI文生圖模型,采用Transformer架構替代傳統UNet,優化了擴散模型的噪聲規劃。CogView-3-Plus在圖像生成方面表現出色,能根...
GLM-4V-Plus
GLM-4V-Plus是智譜AI最新推出的多模態AI模型,專注于圖像和視頻理解。GLM-4V-Plus不僅能夠精確分析靜態圖像,還具備動態視頻內容的時間感知和理解能力,能捕...
auto-video-generator
auto-video-generator是AI自動解說視頻生成器,能實現一鍵生成解說視頻。用戶只需輸入主題,系統便自動撰寫腳本、合成語音、生成圖片并合成視頻,極大提升內...
Video-LLaVA2
Video-LLaVA2是由北京大學ChatLaw課題組研發的開源多模態智能理解系統,通過創新的時空卷積(STC)連接器和音頻分支,提升了視頻和音頻理解能力。模型在視頻...
LLaVA-OneVision
LLaVA-OneVision是字節跳動推出開源的多模態AI模型,LLaVA-OneVision通過整合數據、模型和視覺表示的見解,能同時處理單圖像、多圖像和視頻場景下的計算機視...
CustomCrafter
CustomCrafter 是騰訊和浙江大學聯合提出的自定義視頻生成框架,能基于文本提示和參考圖像生成高質量的個性化視頻,同時保留了運動生成和概念組合的能力。Cus...