MultiAgentPPT
MultiAgentPPT 是多智能體演示文稿生成系統,基于 A2A(Ask-to-Answer)、MCP(Multi-agent Control Protocol)和 ADK(Agent Development Kit)架構。MultiA...
Kling-Foley
Kling-Foley 是可靈 AI 推出的多模態視頻生音效模型。模型將視頻和文本提示作為條件輸入,能生成與視頻內容語義相關、時間同步的高質量立體聲音頻,涵蓋音效...
Nanonets-OCR-s
Nanonets-OCR-s(Nanonets OCR Small)是Nanonets推出的圖像到 Markdown 的 OCR 模型,支持將圖像中的文檔內容轉換為結構化的 Markdown 格式。模型能提取文本...
Kwai Keye-VL
Kwai Keye-VL 是快手自主研發的多模態大語言模型,基于 Qwen3-8B 語言模型整合SigLIP初始化的視覺編碼器,支持動態分辨率輸入。模型能深度融合和處理文本、圖...
Game Worlds
Game Worlds 是 Runway 推出的 AI 游戲創作平臺,通過 AI 技術幫助用戶輕松創建個性化的游戲世界。平臺支持用戶通過簡單的文本描述或上傳圖像,快速生成游戲...