AI項(xiàng)目和框架
Step-Audio-TTS-3B
Step-Audio-TTS-3B 是 Stepfun-AI 團(tuán)隊(duì)推出的高性能文本到語音(TTS)模型,具有強(qiáng)大的語音合成能力?;诤A亢铣蓴?shù)據(jù)訓(xùn)練,參數(shù)量達(dá)到30億,能生成自然流暢...
SWE-Lancer
SWE-Lancer 是 OpenAI 推出的大模型基準(zhǔn)測試,評(píng)估前沿語言模型(LLMs)在自由職業(yè)軟件工程任務(wù)中的表現(xiàn)。包含來自 Upwork 的 1400 多個(gè)任務(wù),總價(jià)值達(dá) 100 ...
DynamicCity
DynamicCity 是上海AI Lab推出的大規(guī)模動(dòng)態(tài)場景生成的4D生成框架。DynamicCity 專注于生成具有語義信息的動(dòng)態(tài) LiDAR 場景,能處理大規(guī)模空間(80×80×6.4 m3)...
Kimi Latest
Kimi Latest是月之暗面Kimi推出的實(shí)時(shí)更新AI模型,為用戶提供同步對(duì)標(biāo)Kimi智能助手的模型體驗(yàn)。支持128k上下文長度,可根據(jù)輸入自動(dòng)選擇8k、32k或128k模型進(jìn)...
SkyReels-A1
SkyReels-A1是昆侖萬維開源的中國首個(gè)SOTA(State-of-the-Art)級(jí)別的基于視頻基座模型的表情動(dòng)作可控算法。SkyReels-A1能實(shí)現(xiàn)更精準(zhǔn)可控的人物視頻生成,能...
Mistral Saba
Mistral Saba 是法國 Mistral AI 推出的專注于中東和南亞地區(qū)語言及文化的區(qū)域定制 AI 模型。模型擁有 240 億參數(shù),規(guī)模雖小,在處理阿拉伯語和印度起源語言...
Finedefics
Finedefics 是北京大學(xué)彭宇新教授團(tuán)隊(duì)推出的細(xì)粒度多模態(tài)大模型,提升多模態(tài)大語言模型(MLLMs)在細(xì)粒度視覺識(shí)別(FGVR)任務(wù)中的表現(xiàn)。模型通過引入對(duì)象的...
Step-Audio
Step-Audio是階躍星辰團(tuán)隊(duì)推出的首個(gè)產(chǎn)品級(jí)的開源語音交互模型,能根據(jù)不同的場景需求生成情緒、方言、語種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地進(jìn)行高...