AI項目和框架

Magentic-UI

Magentic-UI 是微軟推出的開源研究原型,用在探索人類參與的 AI Agent系統。Magentic-UI 是以人為中心的 Web? Agent,能與用戶協作完成復雜的 Web 任務,如瀏...
閱讀原文

MathModelAgent

MathModelAgent 是專為數學建模設計的Agent,能自動完成從問題分析到論文生成的全流程。基于多Agent協作,自動建立數學模型、編寫代碼、驗證結果,生成格式規...
閱讀原文

Steamer-I2V

Steamer-I2V 是百度 Steamer 團隊推出的圖像到視頻生成模型,通過將靜態圖像轉化為動態視頻,展現出卓越的視覺生成能力。模型在 VBench 國際權威的視頻生成評...
閱讀原文

Custom-SVG

Custom-SVG 是Adobe和香港城市大學推出的兩階段風格的SVG定制生成框架,基于文本提示生成具有定制風格的高質量 SVG 圖形。框架推出一種兩階段的生成流程,基...
閱讀原文

YuLan-OneSim

YuLan-OneSim(玉蘭-萬象)是中國人民大學高瓴 AI 學院RUC-GSAI團隊推出的新型社會模擬器。基于大型語言模型(LLM)Agents 模擬人類社會行為,無需編程構建模...
閱讀原文

WorldPM

WorldPM(World Preference Modeling)是阿里巴巴集團的Qwen團隊和復旦大學推出的偏好建模模型系列。基于大規模訓練揭示偏好模型的可擴展性。模型基于1500萬...
閱讀原文

SketchVideo

SketchVideo 是中國科學院大學,香港科技大學和快手可靈團隊推出的基于草圖的視頻生成與編輯框架。在關鍵幀上繪制草圖,結合文本提示,實現對視頻的空間布局...
閱讀原文

AniSora

AniSora 是嗶哩嗶哩開源的先進動漫視頻生成模型,模型支持一鍵生成多種動漫風格的視頻,涵蓋番劇片段、國創動畫、VTuber 內容等。模型包含超過 1000 萬高質量...
閱讀原文

LightLab

LightLab是谷歌等機構推出的基于擴散模型的圖像光源控制模型,能對單張圖像中的光源進行細粒度的參數化控制。支持用戶調整光源的強度和顏色,插入虛擬光源,...
閱讀原文

BLIP3-o

BLIP3-o是Salesforce Research等機構推出的創新多模態模型,融合自回歸模型的推理和指令遵循能力及擴散模型的強大生成能力。模型基于擴散語義豐富的CLIP圖像...
閱讀原文

ShotAdapter

ShotAdapter是Adobe聯合UIUC推出的用在文本到多鏡頭視頻生成的框架,基于微調預訓練的文本到視頻模型,引入過渡標記和局部注意力掩碼策略,實現對多鏡頭視頻...
閱讀原文

Pemo

Pemo是AI驅動的文檔管理工具。工具支持PDF、Epub、Word等多種格式文檔的導入與管理,具備一鍵翻譯、智能總結、思維導圖生成等功能,幫助用戶快速理解復雜文獻...
閱讀原文

OpenMemory MCP

OpenMemory MCP 是mem0推出的基于開放模型上下文協議(MCP)構建的開源工具,能解決 AI 工具記憶痛點,實現不同工具間共享上下文信息。OpenMemory MCP支持 10...
閱讀原文

Toolkami

Toolkami 是極簡的 AI Agent 框架,用七種工具支持運行, 包括讀(Read)、寫(Write Diff)、瀏覽(Browse)、命令(Command)、提問(Ask)、思考(Think)。框架支持 T...
閱讀原文

SWE-1

SWE-1是Windsurf團隊推出的首個軟件工程 AI 模型系列,專為整個軟件開發流程優化,涵蓋代碼生成、測試、調試、資料查找等開發環節,提升開發效率和用戶體驗。
閱讀原文
12829303132146