GLM-4-Plus
GLM-4-Plus是智譜AI最新推出的高智能旗艦大模型,在語言理解和長文本處理上取得突破,采用創新技術如PPO,顯著提升推理和指令遵循能力。GLM-4-Plus在多個關鍵...
CogView-3-Plus
CogView-3-Plus是智譜AI最新推出的AI文生圖模型,采用Transformer架構替代傳統UNet,優化了擴散模型的噪聲規劃。CogView-3-Plus在圖像生成方面表現出色,能根...
GLM-4V-Plus
GLM-4V-Plus是智譜AI最新推出的多模態AI模型,專注于圖像和視頻理解。GLM-4V-Plus不僅能夠精確分析靜態圖像,還具備動態視頻內容的時間感知和理解能力,能捕...
auto-video-generator
auto-video-generator是AI自動解說視頻生成器,能實現一鍵生成解說視頻。用戶只需輸入主題,系統便自動撰寫腳本、合成語音、生成圖片并合成視頻,極大提升內...
Video-LLaVA2
Video-LLaVA2是由北京大學ChatLaw課題組研發的開源多模態智能理解系統,通過創新的時空卷積(STC)連接器和音頻分支,提升了視頻和音頻理解能力。模型在視頻...
LLaVA-OneVision
LLaVA-OneVision是字節跳動推出開源的多模態AI模型,LLaVA-OneVision通過整合數據、模型和視覺表示的見解,能同時處理單圖像、多圖像和視頻場景下的計算機視...