標(biāo)簽:視頻分析
KuaiFormer:智能音響重塑你的聽覺體驗(yàn)
KuaiFormer是快手技術(shù)團(tuán)隊(duì)推出的基于Transformer的檢索框架,用在大規(guī)模內(nèi)容推薦系統(tǒng)。基于重新定義檢索流程,從傳統(tǒng)的分?jǐn)?shù)估計任務(wù)轉(zhuǎn)變?yōu)門ransformer驅(qū)動的“...
VideoPrism
VideoPrism是一個由谷歌研究團(tuán)隊(duì)開發(fā)的通用視頻編碼器,旨在通過一個單一的凍結(jié)模型來處理多種視頻理解任務(wù)。該模型能夠從視頻中提取豐富的語義表示,使其能...
MOFA-Video
MOFA-Video是由騰訊AI實(shí)驗(yàn)室和東京大學(xué)的研究人員開源的一個可控性的圖像生成視頻的模型,該技術(shù)利用生成運(yùn)動場適應(yīng)器對圖像進(jìn)行動畫處理以生成視頻。
VideoAgent
VideoAgent是一種自改進(jìn)的視頻生成系統(tǒng),由斯坦福大學(xué)、滑鐵盧大學(xué)、DeepMind等機(jī)構(gòu)的研究人員共同推出。根據(jù)圖像觀察和語言指令生成視頻計劃,轉(zhuǎn)換為機(jī)器人...
MMBench-Video
MMBench-Video是新穎的長視頻多題問答基準(zhǔn)測試,是浙江大學(xué)、上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)和香港中文大學(xué)聯(lián)合推出的。MMBench-Video能全面評估大型視覺...
12