AI項目和框架

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大學和微軟研究院聯合推出的自回歸視頻生成模型,結合擴散模型的高保真生成能力和自回歸模型的因果性和可控性。Next-Frame...
閱讀原文

SeedVR2

SeedVR2是字節跳動推出的新型單步視頻修復(Video Restoration, VR)模型,基于擴散模型和對抗性后訓練(Adversarial Post-Training, APT)技術。模型基于自...
閱讀原文

HistAgent

HistAgent 是普林斯頓大學 AI 實驗室與復旦大學歷史學系聯合推出的專為歷史研究設計的人工智能助手系統。解決歷史研究中多模態信息處理、跨語言分析和復雜推...
閱讀原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于視頻數據實現對物理世界的理解、預測和規劃。V-JEPA 2 用于 12 億參數的聯合嵌入預測架構(JEPA),基于自監督學習...
閱讀原文

豆包大模型1.6

豆包大模型1.6(Doubao-Seed-1.6)是字節跳動推出的多模態深度思考大模型。模型支持auto、thinking和non-thinking三種思考模式,能處理文字、圖片、視頻等多...
閱讀原文

Reor

Reor是開源的本地化AI個人知識管理應用。應用支持自動鏈接相關筆記、語義搜索和Q&A功能,用戶基于類似Obsidian的Markdown編輯器進行筆記編輯。Reor基于Ol...
閱讀原文

Seedance 1.0

Seedance 1.0 是字節跳動Seed團隊推出的視頻生成基礎模型。模型支持文字與圖片輸入,能生成多鏡頭無縫切換的1080p高品質視頻,具備原生多鏡頭敘事能力,能進...
閱讀原文

o3-pro

o3-pro 是OpenAI推出的強大推理模型,作為 o3 的升級版,在處理復雜問題和提供精準回答方面表現出色,尤其在科學研究、編程、教育和寫作等場景中優勢明顯。o3...
閱讀原文

Magistral

Magistral 是 Mistral AI 推出的推理模型,核心聚焦在透明、多語言和特定領域的推理能力。模型包含 Magistral Small(開源版)和 Magistral Medium(企業版)...
閱讀原文

Vui

Vui 是 Fluxions-AI 團隊開源的輕量級語音對話模型,基于 LLaMA 架構。模型經過 4 萬小時對話訓練,能模擬真實對話中的語氣詞、笑聲和停頓,提供沉浸式交互體...
閱讀原文

Krea 1

Krea 1 是 Krea AI 推出的 AI 圖像生成模型,解決傳統 AI 圖像生成中的“AI 美學”問題。模型能生成高度逼真、紋理清晰的圖像,支持多種藝術風格,提供風格參考...
閱讀原文

InftyThink

InftyThink是創新的大模型推理范式,突破傳統模型在長推理任務中的局限性。通過分段迭代的方式,將復雜的推理過程分解為多個短片段,在每個片段后生成中間總...
閱讀原文

SmolVLA

SmolVLA 是 Hugging Face 開源的輕量級視覺-語言-行動(VLA)模型,專為經濟高效的機器人設計。擁有4.5億參數,模型小巧,可在CPU上運行,單個消費級GPU即可...
閱讀原文

ContentV

ContentV是字節跳動開源的80億參數文生視頻模型框架。將Stable Diffusion 3.5 Large的2D-VAE替換為3D-VAE并引入3D位置編碼,使圖像模型快速獲得視頻生成能力。
閱讀原文

PartCrafter

PartCrafter 是先進的3D生成模型,能從單張RGB圖像中生成多個語義明確且幾何形態各異的3D網格。通過組合潛在空間表示每個3D部件,使用層次化注意力機制在部件...
閱讀原文
13031323334155