AI項目和框架

Veo 3

Veo 3是谷歌I/O開發者大會上發布的新一代視頻生成模型。Veo 3是谷歌首個可生成視頻背景音效的模型,能合成畫面,能為鳥鳴、街頭交通等場景配上相應的音效,可...
閱讀原文

豆包·語音播客模型

豆包·語音播客模型是字節跳動旗下火山引擎推出的語音播客模型。模型基于流式模型構建,可將文本秒級轉化為雙人對話式播客,具有低成本、高時效、強互動特點。...
閱讀原文

II-Agent

II-Agent 是開源的Agent框架,通過與大型語言模型(LLM)的交互,簡化和提升跨多個領域的工作流程。具備多種核心功能,包括研究與事實核查、內容生成、數據分...
閱讀原文

NLWeb

NLWeb 是微軟推出的開源項目,基于簡化網站自然語言界面的創建,讓任何網站都能變成 AI 驅動的應用程序。NLWeb用 Schema.org、RSS 等半結構化數據,結合 LLM ...
閱讀原文

EvoAgentX

EvoAgentX 是開源的 AI Agent 自進化框架,通過進化算法實現多 Agent 系統的自動化生成與優化。能根據目標描述自動生成工作流,通過迭代優化提升性能。
閱讀原文

ScaleMCP

ScaleMCP是普華永道推出的工具選擇方法,動態的為大型語言模型(LLM)Agents 配備Model Context Protocol(MCP)工具。基于自動同步工具存儲系統與MCP服務器...
閱讀原文

Agent Squad

Agent Squad 是輕量級、開源的多 Agents 框架,用在協調多個 AI Agents 處理復雜對話。Agent Squad支持 Python 和 TypeScript 兩種語言,根據用戶輸入動態路...
閱讀原文

Magentic-UI

Magentic-UI 是微軟推出的開源研究原型,用在探索人類參與的 AI Agent系統。Magentic-UI 是以人為中心的 Web? Agent,能與用戶協作完成復雜的 Web 任務,如瀏...
閱讀原文

MathModelAgent

MathModelAgent 是專為數學建模設計的Agent,能自動完成從問題分析到論文生成的全流程。基于多Agent協作,自動建立數學模型、編寫代碼、驗證結果,生成格式規...
閱讀原文

Steamer-I2V

Steamer-I2V 是百度 Steamer 團隊推出的圖像到視頻生成模型,通過將靜態圖像轉化為動態視頻,展現出卓越的視覺生成能力。模型在 VBench 國際權威的視頻生成評...
閱讀原文

Custom-SVG

Custom-SVG 是Adobe和香港城市大學推出的兩階段風格的SVG定制生成框架,基于文本提示生成具有定制風格的高質量 SVG 圖形。框架推出一種兩階段的生成流程,基...
閱讀原文

YuLan-OneSim

YuLan-OneSim(玉蘭-萬象)是中國人民大學高瓴 AI 學院RUC-GSAI團隊推出的新型社會模擬器。基于大型語言模型(LLM)Agents 模擬人類社會行為,無需編程構建模...
閱讀原文

WorldPM

WorldPM(World Preference Modeling)是阿里巴巴集團的Qwen團隊和復旦大學推出的偏好建模模型系列。基于大規模訓練揭示偏好模型的可擴展性。模型基于1500萬...
閱讀原文

SketchVideo

SketchVideo 是中國科學院大學,香港科技大學和快手可靈團隊推出的基于草圖的視頻生成與編輯框架。在關鍵幀上繪制草圖,結合文本提示,實現對視頻的空間布局...
閱讀原文

AniSora

AniSora 是嗶哩嗶哩開源的先進動漫視頻生成模型,模型支持一鍵生成多種動漫風格的視頻,涵蓋番劇片段、國創動畫、VTuber 內容等。模型包含超過 1000 萬高質量...
閱讀原文
13738394041155