標(biāo)簽:多模態(tài)交互

HMoE

HMoE(混合異構(gòu)專家模型)是騰訊混元團(tuán)隊(duì)提出的新型神經(jīng)網(wǎng)絡(luò)架構(gòu),旨在提升大型語(yǔ)言模型的性能和計(jì)算效率。通過引入不同尺寸的專家來處理不同復(fù)雜性的輸入數(shù)...
閱讀原文

VideoLLaMB

VideoLLaMB 是一種創(chuàng)新的長(zhǎng)視頻理解框架,通過引入記憶橋接層和遞歸記憶令牌來處理視頻數(shù)據(jù),確保在分析時(shí)不丟失關(guān)鍵視覺信息。模型特別設(shè)計(jì)用于理解長(zhǎng)時(shí)間視...
閱讀原文

ReHiFace-S

RReHiFace-S是由硅基智能團(tuán)隊(duì)推出的開源項(xiàng)目,實(shí)現(xiàn)高保真、實(shí)時(shí)人臉替換的AI算法,用戶通過簡(jiǎn)單的操作在視頻或直播中進(jìn)行面部交換。
閱讀原文

OLMoE

OLMoE(Open Mixture-of-Experts Language Models)是一個(gè)完全開源的大型語(yǔ)言模型,基于混合專家(MoE)架構(gòu)。OLMoE基于5萬(wàn)億個(gè)token進(jìn)行預(yù)訓(xùn)練,擁有70億總...
閱讀原文
123