AI項目和框架

DeerFlow

DeerFlow 是字節跳動開源的深度研究框架,能幫助用戶高效完成復雜的研究任務。DeerFlow結合語言模型與多種工具,如網絡搜索、爬蟲和 Python 執行,能快速生成...
閱讀原文

WebThinker

WebThinker是中國人民大學、北京智源人工智能研究院和華為泊松實驗室等機構提出的深度研究智能體。WebThinker賦能大型推理模型(LRMs)在推理過程中自主進行...
閱讀原文

Chatlog

Chatlog是開源的聊天記錄分析工具,支持高效解析、可視化和挖掘微信、QQ、Telegram等主流聊天工具的聊天記錄。工具支持從本地數據庫文件獲取數據,提供智能分...
閱讀原文

ZeroSearch

ZeroSearch 是阿里巴巴通義實驗室開源的創新大模型搜索引擎框架,基于強化學習激勵大模型的搜索能力,無需與真實搜索引擎交互。框架愛基于大模型預訓練知識,...
閱讀原文

HunyuanCustom

HunyuanCustom是騰訊混元團隊推出的多模態驅動的定制化視頻生成框架。HunyuanCustom支持圖像、音頻、視頻和文本等多種輸入條件,支持生成具有特定主體和場景...
閱讀原文

ICEdit

ICEdit(In-Context Edit)是浙江大學和哈佛大學推出的指令式圖像編輯框架。基于大規模擴散變換器(Diffusion Transformer)的強大生成能力和上下文感知能力...
閱讀原文

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 語言模型家族中最小的模型的預覽版本。Granite 4.0 Tiny Preview用極高的計算效率和緊湊的模型結構為特...
閱讀原文

Gemini 2.5 Pro (I/O 版)

Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升級版多模態AI模型,具體版本號為 Gemini 2.5 Pro Preview 05-06。模型在編程能力上取得重大突破...
閱讀原文

VPP

VPP(Video Prediction Policy)是清華大學和星動紀元推出的首個AIGC機器人大模型。基于預訓練的視頻擴散模型,學習互聯網上的大量視頻數據,直接預測未來場...
閱讀原文

Amazon Nova Premier

Amazon Nova Premier 是亞馬遜推出功能最強大的多模態 AI 模型,能處理文本、圖像和視頻輸入(不包括音頻),擅長處理需要深度理解上下文、多步驟規劃以及跨...
閱讀原文

D-DiT

D-DiT(Dual Diffusion Transformer)是卡內基梅隆大學、耶魯大學和字節跳動Seed實驗室推出的多模態擴散模型,能統一圖像生成和理解任務。模型結合連續圖像擴...
閱讀原文

NoteLLM

NoteLLM 是小紅書推出的針對筆記推薦的多模態大型語言模型框架。NoteLLM 基于生成筆記的壓縮嵌入和自動生成標簽類別,用大型語言模型(LLM)的強大語義理解能...
閱讀原文

kimi-thinking-preview

kimi-thinking-preview 是月之暗面推出的多模態思考模型,具備深度推理能力,擅長解決復雜問題,如代碼、數學和工作難題。模型基于 reasoning_content 字段展...
閱讀原文

3DV-TON

3DV-TON(Textured 3D-Guided Consistent Video Try-on via Diffusion Models)是阿里巴巴達摩院、湖畔實驗室和浙江大學聯合推出的基于擴散模型的視頻虛擬試...
閱讀原文

ACE-Step

ACE-Step 是 ACE Studio 和 StepFun 聯合推出的開源音樂生成基礎模型,基于創新的架構設計實現高效、連貫且可控的音樂創作。ACE-Step結合擴散模型、深度壓縮...
閱讀原文
145678117