標(biāo)簽:多模態(tài)交互
VideoLLaMB
VideoLLaMB 是一種創(chuàng)新的長(zhǎng)視頻理解框架,通過引入記憶橋接層和遞歸記憶令牌來處理視頻數(shù)據(jù),確保在分析時(shí)不丟失關(guān)鍵視覺信息。模型特別設(shè)計(jì)用于理解長(zhǎng)時(shí)間視...
ReHiFace-S
RReHiFace-S是由硅基智能團(tuán)隊(duì)推出的開源項(xiàng)目,實(shí)現(xiàn)高保真、實(shí)時(shí)人臉替換的AI算法,用戶通過簡(jiǎn)單的操作在視頻或直播中進(jìn)行面部交換。
粵公網(wǎng)安備 44011502001135號(hào)