AI項目和框架

MineWorld

MineWorld是微軟研究院開源的基于《我的世界》(Minecraft)的實時交互式世界模型,基于視覺-動作自回歸Transformer架構,將游戲場景和動作轉化為離散的token...
閱讀原文

FastAPI-MCP

FastAPI-MCP 是將 FastAPI 應用的端點自動轉換為符合模型上下文協議(MCP)的開源工具。具有零配置的特點,只需簡單指向 FastAPI 應用可自動發現并轉換所有端...
閱讀原文

MAI-DS-R1

MAI-DS-R1 是微軟基于 DeepSeek R1 改進的AI模型。MAI-DS-R1基于后訓練優化,支持響應 99.3% 的敏感話題提示,比原版提升 2 倍,將有害內容風險降低 50%。MAI...
閱讀原文

萬相首尾幀模型

萬相首尾幀模型(Wan2.1-FLF2V-14B)是開源的14B參數規模的首尾幀生視頻模型。模型根據用戶提供的首幀和尾幀圖像,自動生成流暢的高清視頻過渡效果,支持多種...
閱讀原文

GoodWeBot

GoodWeBot 是開源的基于 RPA 技術開發的 AI 微信機器人, 支持一鍵免安裝運行,用戶下載后即可直接使用。工具已接入 Coze 等主流 AI,能實現智能回復、私聊群...
閱讀原文

豆包1.5·UI-TARS

豆包1.5·UI-TARS是字節豆包推出的面向圖形界面交互(GUI)的Agent模型。模型基于感知、推理和動作執行等類人能力,與圖形界面進行連續、流暢的交互。模型將視...
閱讀原文

Codex CLI

Codex CLI 是 OpenAI 推出的輕量級終端運行編碼智能體。Codex CLI基于自然語言指令幫助開發者高效生成代碼、執行文件操作和進行版本控制。Codex CLI 支持代碼...
閱讀原文

Neural4D 2o

Neural4D 2o 是 DreamTech 推出的全球首個支持多模態交互的 3D 大模型。模型基于文本、圖像、3D 和運動數據的聯合訓練,實現 3D 生成的上下文一致性、高精準...
閱讀原文

BlenderMCP

BlenderMCP是將Blender與Claude AI基于模型上下文協議(MCP)集成的工具。BlenderMCP用socket服務器實現Blender與AI的雙向通信,支持創建、修改和刪除3D對象...
閱讀原文

OpenAI o4-mini

OpenAI o4-mini 是OpenAI推出的小型推理模型,專為快速、經濟高效的推理而優化。OpenAI o4-mini 在數學、編程和視覺任務方面表現出色,是 AIME 2024 和 2025 ...
閱讀原文

Magnitude

Magnitude 是開源的視覺 AI Agents驅動的端到端測試框架。Magnitude基于自然語言構建測試用例,用強大的推理代理規劃和調整測試流程,基于快速的視覺代理執行...
閱讀原文

Kimina-Prover

Kimina-Prover是月之暗面與Numina團隊合作推出的大型數學定理證明模型,模型采用大規模強化學習訓練,能以類似人類的方式進行推理,在Lean 4語言中嚴謹地證明...
閱讀原文

GLM-Z1-32B

GLM-Z1-32B是智譜公司開源的新一代推理模型,具體參數版本為GLM-Z1-32B-0414 。GLM-Z1-32B基于 GLM-4-32B-0414 基座模型開發,基于深度優化訓練,在數學、代...
閱讀原文

交交

交交是上海交通大學聽覺認知與計算聲學實驗室推出的全球首個純學術界自研的口語對話情感大模型。交交具備多人對話、多語言交流、方言理解、角色扮演、情感互...
閱讀原文

可靈2.0

可靈2.0是快手推出的新一代 AI 視頻生成模型,現已上線可靈AI視頻平臺。平臺更新包含可靈2.0(大師版)和可圖2.0兩大基礎模型。可圖2.0大幅提升圖片生成質量...
閱讀原文
14849505152155