AI項(xiàng)目和框架

Sparc3D

Sparc3D是南洋理工大學(xué)聯(lián)合Sensory Universe和帝國(guó)理工學(xué)院推出的用在高分辨率3D模型生成框架,解決傳統(tǒng)3D生成方法中細(xì)節(jié)丟失和效率低下的問(wèn)題??蚣芙Y(jié)合稀疏...
閱讀原文

Kimi-Dev

Kimi-Dev是Moonshot AI推出的開(kāi)源代碼模型,專(zhuān)為軟件工程任務(wù)設(shè)計(jì)。模型擁有 72B 參數(shù)量,編程水平比最新的DeepSeek-R1還強(qiáng),和閉源模型比較也表現(xiàn)優(yōu)異。在 S...
閱讀原文

MiniMax-M1

MiniMax-M1是MiniMax團(tuán)隊(duì)最新推出的開(kāi)源推理模型,基于混合專(zhuān)家架構(gòu)(MoE)與閃電注意力機(jī)制(lightning attention)相結(jié)合,總參數(shù)量達(dá) 4560 億,每個(gè)token...
閱讀原文

FlowDirector

FlowDirector是西湖大學(xué)AGI Lab團(tuán)隊(duì)聯(lián)合中南大學(xué)推出的新型無(wú)訓(xùn)練(training-free)視頻編輯框架,專(zhuān)門(mén)用在根據(jù)自然語(yǔ)言指令對(duì)視頻內(nèi)容進(jìn)行精確編輯??蚣苤?..
閱讀原文

DreamActor-H1

DreamActor-H1是字節(jié)跳動(dòng)推出的基于擴(kuò)散變換器(Diffusion Transformer, DiT)的框架,支持從配對(duì)的人類(lèi)和產(chǎn)品圖像生成高質(zhì)量的人類(lèi)產(chǎn)品演示視頻。框架注入人...
閱讀原文

Code Researcher

Code Researcher是微軟研究院推出的深度研究Agent工具,專(zhuān)門(mén)用于處理大型系統(tǒng)代碼庫(kù)及其提交歷史,自動(dòng)化修復(fù)系統(tǒng)代碼崩潰問(wèn)題。通過(guò)三個(gè)階段工作:分析(Ana...
閱讀原文

Seaweed APT2

Seaweed APT2是字節(jié)跳動(dòng)推出的創(chuàng)新的AI視頻生成模型,通過(guò)自回歸對(duì)抗后訓(xùn)練(AAPT)技術(shù),將雙向擴(kuò)散模型轉(zhuǎn)化為單向自回歸生成器,實(shí)現(xiàn)高效、高質(zhì)量的視頻生成。
閱讀原文

MAGREF

MAGREF(Masked Guidance for Any?Reference Video Generation)是字節(jié)跳動(dòng)推出的多主體視頻生成框架。MAGREF僅需一張參考圖像和文本提示,能生成高質(zhì)量、主...
閱讀原文

Hunyuan3D-2.1

Hunyuan3D-2.1 是騰訊混元團(tuán)隊(duì)推出的開(kāi)源項(xiàng)目,專(zhuān)注于從圖像生成高保真 3D 資產(chǎn)。具備基于物理的渲染(PBR)材質(zhì)合成能力,能生成逼真的紋理和材質(zhì),如金屬反...
閱讀原文

LLIA

LLIA(Low-Latency Interactive Avatars)是美團(tuán)公司推出的基于擴(kuò)散模型的實(shí)時(shí)音頻驅(qū)動(dòng)肖像視頻生成框架??蚣芑谝纛l輸入驅(qū)動(dòng)虛擬形象的生成,支持實(shí)現(xiàn)低延...
閱讀原文

Next-Frame Diffusion

Next-Frame Diffusion(NFD)是北京大學(xué)和微軟研究院聯(lián)合推出的自回歸視頻生成模型,結(jié)合擴(kuò)散模型的高保真生成能力和自回歸模型的因果性和可控性。Next-Frame...
閱讀原文

SeedVR2

SeedVR2是字節(jié)跳動(dòng)推出的新型單步視頻修復(fù)(Video Restoration, VR)模型,基于擴(kuò)散模型和對(duì)抗性后訓(xùn)練(Adversarial Post-Training, APT)技術(shù)。模型基于自...
閱讀原文

HistAgent

HistAgent 是普林斯頓大學(xué) AI 實(shí)驗(yàn)室與復(fù)旦大學(xué)歷史學(xué)系聯(lián)合推出的專(zhuān)為歷史研究設(shè)計(jì)的人工智能助手系統(tǒng)。解決歷史研究中多模態(tài)信息處理、跨語(yǔ)言分析和復(fù)雜推...
閱讀原文

V-JEPA 2

V-JEPA 2 是Meta AI推出的世界大模型,基于視頻數(shù)據(jù)實(shí)現(xiàn)對(duì)物理世界的理解、預(yù)測(cè)和規(guī)劃。V-JEPA 2 用于 12 億參數(shù)的聯(lián)合嵌入預(yù)測(cè)架構(gòu)(JEPA),基于自監(jiān)督學(xué)習(xí)...
閱讀原文

豆包大模型1.6

豆包大模型1.6(Doubao-Seed-1.6)是字節(jié)跳動(dòng)推出的多模態(tài)深度思考大模型。模型支持auto、thinking和non-thinking三種思考模式,能處理文字、圖片、視頻等多...
閱讀原文
12021222324146