標(biāo)簽:多語言支持
Lumina-Video
Lumina-Video是上海 AI Lab 和香港中文大學(xué)推出的視頻生成框架,基于Next-DiT架構(gòu),針對(duì)視頻生成中的時(shí)空復(fù)雜性進(jìn)行優(yōu)化。基于多尺度Next-DiT架構(gòu),用不同大...
YAYI-Ultra
YAYI-Ultra 是中科聞歌研發(fā)的企業(yè)級(jí)大語言模型的旗艦版本,具備強(qiáng)大的多領(lǐng)域?qū)I(yè)能力和多模態(tài)內(nèi)容生成能力。支持?jǐn)?shù)學(xué)、代碼、金融、輿情、中醫(yī)、安全等多個(gè)領(lǐng)...
Zonos-v0.1
Zonos-v0.1是Zyphra推出的高保真文本到語音(TTS)模型。Zonos-v0.1包含兩個(gè)模型:16億參數(shù)的Transformer模型和SSM混合模型,均在Apache 2.0許可下開源。Zono...
WorldSense
WorldSense是小紅書和上海交通大學(xué)推出的,用在評(píng)估多模態(tài)大型語言模型(MLLMs)在現(xiàn)實(shí)世界場(chǎng)景中對(duì)視覺、聽覺和文本輸入的綜合理解能力的基準(zhǔn)測(cè)試。WorldSen...
AI Chat-avatar
AI Chat-avatar 是 AI 驅(qū)動(dòng)的數(shù)字人交互助手,通過高度個(gè)性化的互動(dòng)體驗(yàn)提升溝通效率與用戶參與度。具備多語言支持,能實(shí)時(shí)翻譯并進(jìn)行自然對(duì)話,打破語言障礙...