AI項(xiàng)目和框架

Step-Audio-TTS-3B

Step-Audio-TTS-3B 是 Stepfun-AI 團(tuán)隊(duì)推出的高性能文本到語音(TTS)模型,具有強(qiáng)大的語音合成能力?;诤A亢铣蓴?shù)據(jù)訓(xùn)練,參數(shù)量達(dá)到30億,能生成自然流暢...
閱讀原文

SWE-Lancer

SWE-Lancer 是 OpenAI 推出的大模型基準(zhǔn)測試,評(píng)估前沿語言模型(LLMs)在自由職業(yè)軟件工程任務(wù)中的表現(xiàn)。包含來自 Upwork 的 1400 多個(gè)任務(wù),總價(jià)值達(dá) 100 ...
閱讀原文

DynamicCity

DynamicCity 是上海AI Lab推出的大規(guī)模動(dòng)態(tài)場景生成的4D生成框架。DynamicCity 專注于生成具有語義信息的動(dòng)態(tài) LiDAR 場景,能處理大規(guī)模空間(80×80×6.4 m3)...
閱讀原文

MoBA

MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力機(jī)制,提高大型語言模型(LLMs)處理長上下文任務(wù)的效率。通過將上下文劃分為多個(gè)塊(bl...
閱讀原文

RSIDiff

RSIDiff 是用于提升文本到圖像擴(kuò)散模型性能的遞歸自訓(xùn)練(RSI)框架。通過迭代優(yōu)化模型,基于模型自身生成的數(shù)據(jù)進(jìn)行訓(xùn)練,解決傳統(tǒng)自訓(xùn)練中常見的訓(xùn)練崩潰問...
閱讀原文

Kimi Latest

Kimi Latest是月之暗面Kimi推出的實(shí)時(shí)更新AI模型,為用戶提供同步對(duì)標(biāo)Kimi智能助手的模型體驗(yàn)。支持128k上下文長度,可根據(jù)輸入自動(dòng)選擇8k、32k或128k模型進(jìn)...
閱讀原文

Omnitool

Omnitool是開源的AI桌面環(huán)境,為用戶提供統(tǒng)一的交互界面,能快速接入和使用多種AI模型。Omnitool支持本地運(yùn)行,能在Mac、Windows或Linux設(shè)備上安裝,數(shù)據(jù)存儲(chǔ)...
閱讀原文

Qihoo-T2X

Qihoo-T2X 是360 AI 研究院和中山大學(xué)推出的基于代理標(biāo)記化擴(kuò)散 Transformer(PT-DiT)的高效多模態(tài)生成模型,Qihoo-T2X引入稀疏代理標(biāo)記注意力機(jī)制,顯著降...
閱讀原文

Grok-3

Grok-3是埃隆·馬斯克旗下xAI公司推出的最新一代人工智能模型,模型被馬斯克稱為“地球上最聰明的人工智能”,推理能力在多項(xiàng)基準(zhǔn)測試中超越了包括ChatGPT和Deep...
閱讀原文

LangFlow

LangFlow 是低代碼、可視化的 AI 應(yīng)用構(gòu)建工具,用于快速搭建和實(shí)驗(yàn) LangChain 流水線。通過拖拽式界面,用戶能輕松創(chuàng)建復(fù)雜的 AI 工作流,無需編寫大量代碼...
閱讀原文

SkyReels-A1

SkyReels-A1是昆侖萬維開源的中國首個(gè)SOTA(State-of-the-Art)級(jí)別的基于視頻基座模型的表情動(dòng)作可控算法。SkyReels-A1能實(shí)現(xiàn)更精準(zhǔn)可控的人物視頻生成,能...
閱讀原文

Mistral Saba

Mistral Saba 是法國 Mistral AI 推出的專注于中東和南亞地區(qū)語言及文化的區(qū)域定制 AI 模型。模型擁有 240 億參數(shù),規(guī)模雖小,在處理阿拉伯語和印度起源語言...
閱讀原文

Finedefics

Finedefics 是北京大學(xué)彭宇新教授團(tuán)隊(duì)推出的細(xì)粒度多模態(tài)大模型,提升多模態(tài)大語言模型(MLLMs)在細(xì)粒度視覺識(shí)別(FGVR)任務(wù)中的表現(xiàn)。模型通過引入對(duì)象的...
閱讀原文

Step-Audio

Step-Audio是階躍星辰團(tuán)隊(duì)推出的首個(gè)產(chǎn)品級(jí)的開源語音交互模型,能根據(jù)不同的場景需求生成情緒、方言、語種、歌聲和個(gè)性化風(fēng)格的表達(dá),能和用戶自然地進(jìn)行高...
閱讀原文

Matrix3D

Matrix3D 是南京大學(xué)、蘋果公司和香港科技大學(xué)合作推出的新型的統(tǒng)一攝影測量模型,能在一個(gè)模型中完成多個(gè)攝影測量子任務(wù),包括姿態(tài)估計(jì)、深度預(yù)測和新視圖合...
閱讀原文
16263646566146