AI項目和框架

DeepEP

DeepEP 是 DeepSeek 開源的首個專為混合專家模型(MoE)訓練和推理設計的開源 EP(專家并行)通信庫。提供了高吞吐量和低延遲的全對全 GPU 內核,支持節點內...
閱讀原文

QwQ-Max

QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作為預覽版本推出,QwQ-Max即將正式發布并全面開源。QwQ-Max專...
閱讀原文

FantasyID

FantasyID 是阿里巴巴集團和北京郵電大學推出新型的身份保持視頻生成(IPT2V)框架,基于增強人臉知識生成高質量的身份一致視頻。FantasyID基于擴散變換器(D...
閱讀原文

SigStyle

SigStyle 是吉林大學、南京大學智能科學與技術學院及Adobe推出的新型簽名風格遷移框架,支持將單張風格圖像中獨特的視覺特征(如幾何結構、色彩搭配、筆觸等...
閱讀原文

GRUtopia 2.0

GRUtopia 2.0(桃源2.0)是上海人工智能實驗室發布的通用具身智能仿真平臺。平臺在GRUtopia 1.0的基礎上進行了全面升級,具備三大核心創新:通用模塊化框架、...
閱讀原文

BioMedGPT-R1

BioMedGPT-R1 是清華大學AI產業研究院(AIR)與北京水木分子生物科技有限公司聯合推出的升級版多模態生物醫藥開源大模型。BioMedGPT-R1基于 DeepSeek R1 技術...
閱讀原文

SigLIP 2

SigLIP 2 是Google DeepMind 提出先進的多語言視覺-語言模型 ,是 SigLIP 的升級版本,提升圖像與文本之間的對齊能力。通過改進的訓練方法和架構,顯著增強了...
閱讀原文

AvatarGO

AvatarGO 是南洋理工大學S-Lab、上海 AI Lab,香港大學聯合推出的新型框架,用在從文本輸入直接生成可動畫化的 4D 人體與物體交互場景。通過零樣本(zero-sho...
閱讀原文

Moonlight-16B-A3B

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 億總參數和 30 億激活參數。模型使用了優化后的 Muon 優化器進行訓練...
閱讀原文

FlashMLA

FlashMLA 是 DeepSeek 開源的針對 NVIDIA Hopper 架構 GPU 優化的高效 MLA(Multi-Head Linear Attention)解碼內核,專為處理可變長度序列設計。通過優化 KV...
閱讀原文

MagicArticulate

MagicArticulate 是南洋理工大學和字節跳動Seed實驗室推出的自動將靜態 3D 模型轉換為可動畫化資產的框架。MagicArticulate基于自回歸生成骨架,預測蒙皮權重...
閱讀原文

TANGLED

TANGLED是上海科技大學、Deemos Technology和華中科技大學聯合推出的3D發型生成方法,支持從任意風格和視角的圖像中生成高質量的3D發絲。TANGLED基于三個核心...
閱讀原文

Llasa TTS

Llasa TTS 是香港科技大學基于 LLaMA 架構推出的開源文本轉語音(TTS)模型,支持高質量語音合成和克隆。Llasa TTS 基于單層向量量化(VQ)編解碼器和單個 Tr...
閱讀原文

OOMOL

OOMOL (悟墨)是基于 VSCode 打造的現代化集成開發環境(IDE),專為工作流自動化而設計。通過拖拽式圖形化界面,讓用戶能直觀地搭建復雜的工作流,無需編程...
閱讀原文

Evo 2

Evo 2 是美國弧形研究所、英偉達、斯坦福大學等機構合作推出的DNA語言模型,用于基因組建模和設計,覆蓋生命的所有領域。Evo 2 基于 StripedHyena 2 架構開發...
閱讀原文
16970717273155