標簽:視頻分析

KuaiFormer:智能音響重塑你的聽覺體驗

KuaiFormer是快手技術團隊推出的基于Transformer的檢索框架,用在大規模內容推薦系統。基于重新定義檢索流程,從傳統的分數估計任務轉變為Transformer驅動的“...
閱讀原文

VideoPrism

VideoPrism是一個由谷歌研究團隊開發的通用視頻編碼器,旨在通過一個單一的凍結模型來處理多種視頻理解任務。該模型能夠從視頻中提取豐富的語義表示,使其能...
閱讀原文

ExVideo

ExVideo是由阿里巴巴和華東師大的研究人員推出的一種視頻合成模型的后調優技術,能夠擴展現有視頻合成模型的時間尺度,以生成更長的視頻。該團隊基于Stable V...
閱讀原文

MOFA-Video

MOFA-Video是由騰訊AI實驗室和東京大學的研究人員開源的一個可控性的圖像生成視頻的模型,該技術利用生成運動場適應器對圖像進行動畫處理以生成視頻。
閱讀原文

商湯如影

商湯如影是商湯科技推出的AI數字人視頻生成平臺,通過商湯的大模型技術,創建出高度逼真的數字人形象,用于教育、金融、營銷等多個行業。平臺提供快速定制、...
閱讀原文

FineVideo

FineVideo是由Hugging Face推出的一個大型多模態視頻數據集,專注于視頻理解領域中的復雜任務,如情緒分析、故事敘述和媒體編輯。FineVideo包含超過43,000個Y...
閱讀原文

VideoAgent

VideoAgent是一種自改進的視頻生成系統,由斯坦福大學、滑鐵盧大學、DeepMind等機構的研究人員共同推出。根據圖像觀察和語言指令生成視頻計劃,轉換為機器人...
閱讀原文

MMBench-Video

MMBench-Video是新穎的長視頻多題問答基準測試,是浙江大學、上海人工智能實驗室、上海交通大學和香港中文大學聯合推出的。MMBench-Video能全面評估大型視覺...
閱讀原文

MotionCLR

MotionCLR是基于注意力機制的人體動作生成和編輯模型,能根據文本提示生成動作,支持用戶進行交互式編輯,如動作強調、減弱、替換、擦除和風格轉移。MotionCL...
閱讀原文
12