AI項目和框架

Hailuo 02

Hailuo 02 是 MiniMax 公司推出的全新AI視頻生成模型,是Hailuo 01的升級版本。這個模型目前在圖生視頻、文生視頻的榜單位于第二,超越快手的可靈以及谷歌的V...
閱讀原文

LeVo

LeVo是騰訊AI實驗室推出的AI唱歌模型,具備強大的音色克隆能力,僅需3秒音頻即可精準復制目標音色,包括音調、情感和韻律,無需大量訓練數據。LeVo支持分軌生...
閱讀原文

Sparc3D

Sparc3D是南洋理工大學聯合Sensory Universe和帝國理工學院推出的用在高分辨率3D模型生成框架,解決傳統3D生成方法中細節丟失和效率低下的問題。框架結合稀疏...
閱讀原文

Kimi-Dev

Kimi-Dev是Moonshot AI推出的開源代碼模型,專為軟件工程任務設計。模型擁有 72B 參數量,編程水平比最新的DeepSeek-R1還強,和閉源模型比較也表現優異。在 S...
閱讀原文

MiniMax-M1

MiniMax-M1是MiniMax團隊最新推出的開源推理模型,基于混合專家架構(MoE)與閃電注意力機制(lightning attention)相結合,總參數量達 4560 億,每個token...
閱讀原文

FlowDirector

FlowDirector是西湖大學AGI Lab團隊聯合中南大學推出的新型無訓練(training-free)視頻編輯框架,專門用在根據自然語言指令對視頻內容進行精確編輯。框架直...
閱讀原文

DreamActor-H1

DreamActor-H1是字節跳動推出的基于擴散變換器(Diffusion Transformer, DiT)的框架,支持從配對的人類和產品圖像生成高質量的人類產品演示視頻。框架注入人...
閱讀原文

Code Researcher

Code Researcher是微軟研究院推出的深度研究Agent工具,專門用于處理大型系統代碼庫及其提交歷史,自動化修復系統代碼崩潰問題。通過三個階段工作:分析(Ana...
閱讀原文

Seaweed APT2

Seaweed APT2是字節跳動推出的創新的AI視頻生成模型,通過自回歸對抗后訓練(AAPT)技術,將雙向擴散模型轉化為單向自回歸生成器,實現高效、高質量的視頻生成。
閱讀原文

MAGREF

MAGREF(Masked Guidance for Any?Reference Video Generation)是字節跳動推出的多主體視頻生成框架。MAGREF僅需一張參考圖像和文本提示,能生成高質量、主...
閱讀原文

Hunyuan3D-2.1

Hunyuan3D-2.1 是騰訊混元團隊推出的開源項目,專注于從圖像生成高保真 3D 資產。具備基于物理的渲染(PBR)材質合成能力,能生成逼真的紋理和材質,如金屬反...
閱讀原文

LLIA

LLIA(Low-Latency Interactive Avatars)是美團公司推出的基于擴散模型的實時音頻驅動肖像視頻生成框架。框架基于音頻輸入驅動虛擬形象的生成,支持實現低延...
閱讀原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大學和微軟研究院聯合推出的自回歸視頻生成模型,結合擴散模型的高保真生成能力和自回歸模型的因果性和可控性。Next-Frame...
閱讀原文

SeedVR2

SeedVR2是字節跳動推出的新型單步視頻修復(Video Restoration, VR)模型,基于擴散模型和對抗性后訓練(Adversarial Post-Training, APT)技術。模型基于自...
閱讀原文

HistAgent

HistAgent 是普林斯頓大學 AI 實驗室與復旦大學歷史學系聯合推出的專為歷史研究設計的人工智能助手系統。解決歷史研究中多模態信息處理、跨語言分析和復雜推...
閱讀原文
12930313233155