FLUX.1Kontext
FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進行生成與編輯,支持對象修改、風格...
SearchAgent-X
SearchAgent-X 是南開大學和伊利諾伊大學厄巴納香檳分校(UIUC)研究人員推出的高效推理框架,能提升基于大型語言模型(LLM)的搜索Agent的效率。
MagicTryOn
MagicTryOn是浙江大學計算機科學與技術學院、vivo移動通信等機構推出的基于視頻擴散Transformer的視頻虛擬試穿框架。框架替換傳統的U-Net架構為更具表現力的...
Paper2Poster
Paper2Poster是加拿大滑鐵盧大學、新加坡國立大學等機構推出的創新學術框架,基于多模態自動化技術從科學論文生成海報。Paper2Poster推出PosterAgent,一個自...
OmniConsistency
OmniConsistency 是新加坡國立大學推出的圖像風格遷移模型,能解決復雜場景下風格化圖像的一致性問題。模型基于大規模配對的風格化數據進行訓練,用兩階段訓...
AI-Media2Doc
AI-Media2Doc 是開源的音視頻轉文檔工具,基于AI大模型技術,支持將音視頻內容智能轉換為小紅書筆記、公眾號文章、知識筆記、思維導圖和視頻字幕等多種文檔形...
DeepSeek-R1-0528
DeepSeek-R1-0528 是 DeepSeek 團隊推出的最新版AI模型。模型基于 DeepSeek-V3-0324 訓練,參數量達 660B。模型在 HuggingFace 上開源,開發者能自由使用和修...