Evolving Agents
Evolving Agents 是用在創建、管理和進化 AI 代理的生產級框架。Evolving Agents支持智能代理之間的通信和協作,根據語義理解需求、基于過往經驗進化,有效解...
Open-Sora 2.0
Open-Sora 2.0 是潞晨科技推出的全新開源SOTA(State-of-the-Art)視頻生成模型。Open-Sora 2.0 用 20 萬美元(224 張 GPU)成功訓練出 11B 參數的商業級模型...
Gemini Robotics
Gemini Robotics 是谷歌 DeepMind 推出的基于 Gemini 2.0 的機器人項目,將大型多模態模型的能力引入物理世界。項目包含兩個主要模型:Gemini Robotics-ER 和...
PP-TableMagic
PP-TableMagic 是百度飛槳團隊推出的高性能表格識別工具,用在將圖片中的表格結構化信息提取出來,轉換為 HTML 等格式,進行進一步的數據處理和分析。PP-Tabl...
Motion Anything
Motion Anything 是澳大利亞國立大學、悉尼大學、騰訊、麥吉爾大學、京東等機構推出的多模態運動生成框架,根據文本、音樂或兩者的組合生成高質量、可控的人...
Reka Flash 3
Reka Flash 3 是 Reka AI 推出的開源推理模型,擁有 21 億參數。支持多模態輸入,包括文本、圖像、視頻和音頻,可處理最多 32k 個令牌的上下文長度,適用于一...
MM-StoryAgent
MM-StoryAgent 是上海交通大學X-LANCE實驗室和阿里巴巴集團聯合推出的開源、多模態、多智能體框架,用在生成沉浸式的有聲故事繪本視頻?;诮Y合大型語言模型...
Deep Research Web UI
Deep Research Web UI 是開源的 AI 研究助手工具,幫助用戶高效地進行深度研究。通過 AI 驅動的迭代搜索,逐步深入挖掘指定主題,以樹狀結構可視化研究過程,...