AI項(xiàng)目和框架

SpatialGen

SpatialGen 是群核科技開源的 3D 場(chǎng)景生成模型。模型基于擴(kuò)散模型架構(gòu),支持根據(jù)文字描述、參考圖像和 3D 空間布局,生成時(shí)空一致的多視角圖像,且能進(jìn)一步得...
閱讀原文

問小白o(hù)4

問小白o(hù)4是國(guó)內(nèi)首個(gè)并行思考模型,能同時(shí)啟動(dòng)8條思考路徑,自動(dòng)篩選最優(yōu)解,提供精準(zhǔn)答案。模型融合Long?CoT強(qiáng)化學(xué)習(xí)與過程獎(jiǎng)勵(lì)學(xué)習(xí),具備深度推理和高質(zhì)量思...
閱讀原文

FutureX

FutureX是字節(jié)跳動(dòng)、復(fù)旦大學(xué)、斯坦福大學(xué)和普林斯頓大學(xué)的研究團(tuán)隊(duì)聯(lián)合發(fā)布的,專為L(zhǎng)LM智能體未來預(yù)測(cè)任務(wù)設(shè)計(jì)的動(dòng)態(tài)實(shí)時(shí)評(píng)估基準(zhǔn)。通過半自動(dòng)化管道從195個(gè)...
閱讀原文

DeepSeek V3.1

DeepSeek V3.1是DeepSeek最新推出的AI模型版本,具備混合推理架構(gòu),能自由切換思考模式與非思考模式,思考效率顯著提升。模型在V3的基礎(chǔ)上進(jìn)行多項(xiàng)升級(jí),上下...
閱讀原文

SlowFast-LLaVA-1.5

SlowFast-LLaVA-1.5(簡(jiǎn)稱SF-LLaVA-1.5)是專為長(zhǎng)視頻理解設(shè)計(jì)的高效視頻大語言模型。基于雙流(SlowFast)機(jī)制,平衡處理更多輸入幀與減少每幀令牌數(shù)量之間...
閱讀原文

ComoRAG

ComoRAG 是華南理工大學(xué)未來技術(shù)學(xué)院、微信 AI 團(tuán)隊(duì)等機(jī)構(gòu)聯(lián)合推出的認(rèn)知啟發(fā)式檢索增強(qiáng)生成(RAG)框架,專門用在長(zhǎng)篇敘事文本的理解和推理。
閱讀原文

Grok 2.5

Grok 2.5 是埃隆·馬斯克旗下 xAI 公司開源的人工智能模型。模型文件可在 Hugging Face 下載,包含 42 個(gè)文件,總大小約 500GB,需 8 張顯存超 40GB 的 GPU 才...
閱讀原文

Fun-ASR

Fun-ASR 是釘釘與通義實(shí)驗(yàn)室語音團(tuán)隊(duì)聯(lián)合推出的新一代語音識(shí)別大模型。經(jīng)過海量音頻數(shù)據(jù)訓(xùn)練,能精準(zhǔn)識(shí)別互聯(lián)網(wǎng)、科技、家裝、畜牧等十多個(gè)行業(yè)的專業(yè)術(shù)語,...
閱讀原文

Intern-S1-mini

Intern-S1-mini是上海人工智能實(shí)驗(yàn)室推出的輕量級(jí)開源多模態(tài)推理模型。基于與 Intern-S1 相同的技術(shù)構(gòu)建。模型融合 8B 密集語言模型(Qwen3)和 0.3B 視覺編...
閱讀原文

Seed-OSS

Seed-OSS 是字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)開源的系列大型語言模型,專注于長(zhǎng)文本處理、推理和智能代理能力。模型包含多個(gè)版本,如 Seed-OSS-36B-Base 和 Seed-OSS-36B-I...
閱讀原文

AutoCodeBench

AutoCodeBench 是騰訊混元推出的專門測(cè)評(píng)大模型代碼能力基準(zhǔn)測(cè)試集,包含 3920 個(gè)問題,均勻分布在 20 種編程語言中。數(shù)據(jù)集具有高難度、實(shí)用性和多樣性,能...
閱讀原文

NVIDIA Nemotron Nano 2

NVIDIA Nemotron Nano 2 是英偉達(dá)推出的高效推理模型,參數(shù)量為9B。模型基于混合Mamba-Transformer架構(gòu),在20萬億個(gè)token上預(yù)訓(xùn)練,支持128k上下文長(zhǎng)度。
閱讀原文

CombatVLA

CombatVLA 是淘天集團(tuán)未來生活實(shí)驗(yàn)室團(tuán)隊(duì)推出的專為3D動(dòng)作角色扮演游戲(ARPG)中的戰(zhàn)斗任務(wù)設(shè)計(jì)的高效視覺-語言-動(dòng)作(VLA)模型。模型基于3B參數(shù)規(guī)模,通過...
閱讀原文

Klear-Reasoner

Klear-Reasoner 是快手推出的基于 Qwen3-8B-Base 的推理模型,專注于提升數(shù)學(xué)和代碼推理能力。模型通過長(zhǎng)思維鏈監(jiān)督微調(diào)(long CoT SFT)和強(qiáng)化學(xué)習(xí)(RL)訓(xùn)...
閱讀原文

Nano Banana

Nano Banana 是 AI 圖像編輯模型,目前僅在 LMArena 網(wǎng)站上隨機(jī)出現(xiàn)。模型因極高的人物一致性著稱,能精準(zhǔn)還原人物的面部特征和表情,同時(shí)在背景替換和風(fēng)格轉(zhuǎn)...
閱讀原文
11718192021155