標(biāo)簽:多語言支持

Lumina-Video

Lumina-Video是上海 AI Lab 和香港中文大學(xué)推出的視頻生成框架,基于Next-DiT架構(gòu),針對(duì)視頻生成中的時(shí)空復(fù)雜性進(jìn)行優(yōu)化。基于多尺度Next-DiT架構(gòu),用不同大...
閱讀原文

Zonos

Zonos是Zyphra推出的高保真文本到語音(TTS)模型。Zonos包含兩個(gè)模型:16億參數(shù)的Transformer模型和SSM混合模型,均在Apache 2.0許可下開源。Zonos根據(jù)文本...
閱讀原文

potpie.ai

potpie.ai 是開源平臺(tái),基于AI技術(shù)為代碼庫(kù)創(chuàng)建定制化的工程代理(Agents)。potpie.ai基于構(gòu)建代碼庫(kù)的知識(shí)圖譜,深度理解代碼組件之間的關(guān)系,實(shí)現(xiàn)自動(dòng)化代...
閱讀原文

華為小藝

華為小藝是華為推出的小藝AI助手網(wǎng)頁(yè)端,用戶可以通過瀏覽器直接訪問使用。適配了手機(jī)和PC布局,提供多種功能,包括AI問答、AI寫作、編程助手和AI翻譯等。小...
閱讀原文

TPO

TPO(Test-Time Preference Optimization)是新型的AI優(yōu)化框架,在推理階段對(duì)語言模型輸出進(jìn)行動(dòng)態(tài)優(yōu)化,更符合人類偏好。TPO通過將獎(jiǎng)勵(lì)信號(hào)轉(zhuǎn)化為文本反饋,...
閱讀原文

YAYI-Ultra

YAYI-Ultra 是中科聞歌研發(fā)的企業(yè)級(jí)大語言模型的旗艦版本,具備強(qiáng)大的多領(lǐng)域?qū)I(yè)能力和多模態(tài)內(nèi)容生成能力。支持?jǐn)?shù)學(xué)、代碼、金融、輿情、中醫(yī)、安全等多個(gè)領(lǐng)...
閱讀原文

HUGWBC

HUGWBC(Humanoid Unified and General Whole-Body Controller)是上海交通大學(xué)、上海AI Lab聯(lián)合推出的人形機(jī)器人全身控制器,能實(shí)現(xiàn)精細(xì)的運(yùn)動(dòng)控制。HUGWBC...
閱讀原文

Zonos-v0.1

Zonos-v0.1是Zyphra推出的高保真文本到語音(TTS)模型。Zonos-v0.1包含兩個(gè)模型:16億參數(shù)的Transformer模型和SSM混合模型,均在Apache 2.0許可下開源。Zono...
閱讀原文

Goku

Goku是香港大學(xué)和字節(jié)跳動(dòng)聯(lián)合發(fā)布的最新視頻生成模型,專為圖像和視頻的聯(lián)合生成設(shè)計(jì)。基于先進(jìn)的rectified flow Transformer框架,支持文生視頻、圖生視頻...
閱讀原文

ACE++

ACE++是阿里巴巴通義實(shí)驗(yàn)室推出的先進(jìn)的圖像生成與編輯工具,通過指令化和上下文感知的內(nèi)容填充技術(shù),實(shí)現(xiàn)了高質(zhì)量的圖像創(chuàng)作和編輯功能。
閱讀原文

LangBot

LangBot 是開源的即時(shí)聊天機(jī)器人平臺(tái),支持多平臺(tái)(如 QQ、微信、飛書、Discord 等)和多種大語言模型(如 ChatGPT、DeepSeek、Gemini 等)。LangBot具備多模...
閱讀原文

WorldSense

WorldSense是小紅書和上海交通大學(xué)推出的,用在評(píng)估多模態(tài)大型語言模型(MLLMs)在現(xiàn)實(shí)世界場(chǎng)景中對(duì)視覺、聽覺和文本輸入的綜合理解能力的基準(zhǔn)測(cè)試。WorldSen...
閱讀原文

AI Chat-avatar

AI Chat-avatar 是 AI 驅(qū)動(dòng)的數(shù)字人交互助手,通過高度個(gè)性化的互動(dòng)體驗(yàn)提升溝通效率與用戶參與度。具備多語言支持,能實(shí)時(shí)翻譯并進(jìn)行自然對(duì)話,打破語言障礙...
閱讀原文

EliGen

EliGen是浙江大學(xué)和阿里巴巴集團(tuán)聯(lián)合開發(fā)的新型的實(shí)體級(jí)可控圖像生成框架,通過引入?yún)^(qū)域注意力機(jī)制,無需額外參數(shù)即可將實(shí)體提示和任意形狀的空間掩碼無縫集...
閱讀原文

Hibiki

Hibiki是Kyutai Labs開源的用在同時(shí)語音翻譯的解碼器模型,能實(shí)時(shí)將一種語言的語音翻譯成另一種語言的語音或文本。Hibiki基于多流語言模型架構(gòu),同步處理源語...
閱讀原文
1181920212261