AI項目和框架

DevDocs

DevDocs 是專為程序員和開發者設計的開源技術文檔爬取和處理工具,基于智能爬蟲技術,快速爬取、整理技術文檔,將理解文檔的時間從數周縮短至幾小時。DevDocs...
閱讀原文

MoLing

MoLing 是無依賴的本地辦公自動化助手,是基于計算機和瀏覽器使用的 MCP 服務器。MoLing 基于操作系統 API 實現系統交互,支持文件系統操作(如讀寫、合并、...
閱讀原文

Multi-SWE-bench

Multi-SWE-bench 是字節跳動豆包大模型團隊開源的首個多語言代碼修復基準。在SWE-bench基礎上,首次覆蓋Python之外的7種主流編程語言,包括Java、TypeScript...
閱讀原文

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延遲的 AI 模型,基于 Gemini 2.5 模型構建。Gemini 2.5 Flash在保持低延遲和成本效益的同時,引入思考能力。
閱讀原文

A2A

A2A(Agent2Agent)是谷歌開源的首個標準智能體交互協議,讓不同框架和供應商構建的AI智能體相互協作。A2A基于標準化的通信方式,打破系統孤島,讓智能體安全...
閱讀原文

DCEdit

DCEdit 是新型的雙層控制圖像編輯方法,是北京交通大學和美圖2MT實驗室聯合推出的。DCEdit基于精確語義定位策略(PSL),用視覺和文本自注意力優化交叉注意力...
閱讀原文

LocAgent

LocAgent是斯坦福大學、耶魯大學和南加州大學等機構聯合推出的,專注于代碼定位任務的框架,幫助開發者快速準確地找到代碼庫中需要修改的部分。LocAgent將代...
閱讀原文

OmniSVG

OmniSVG 是復旦大學和 StepFun 聯合開發的全球首個端到端多模態 SVG(可縮放矢量圖形)生成模型?;陬A訓練視覺語言模型(VLM),通過創新的 SVG 標記化方法...
閱讀原文

Lipsync-2

Lipsync-2 是 Sync Labs 推出的全球首個零-shot 嘴型同步模型。無需針對特定演講者進行預訓練,能即時學習并生成符合獨特說話風格的嘴型同步效果。
閱讀原文

Llama Nemotron

Llama Nemotron是NVIDIA推出的一系列推理模型,專注于推理和多種智能代理(agentic AI)任務。模型基于Llama開源模型,經過NVIDIA的后訓練,加入推理能力,在...
閱讀原文

Dream-7B

Dream-7B是香港大學和華為諾亞方舟實驗室聯合推出的擴散式推理模型,是目前最強大的開源擴散大語言模型。Dream-7B訓練數據涵蓋文本、數學和代碼,預訓練使用5...
閱讀原文

Miracle F1

Miracle F1 是美圖 WHEE 推出的全新AI圖像生成模型。具備強大的圖像生成能力,能像攝影師、建筑師和畫家一樣精準地處理光影、空間和材質效果,生成的圖像真實...
閱讀原文

DeepCoder-14B-Preview

DeepCoder-14B-Preview 是 Agentica 和 Together AI 聯合開源的大型代碼生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微調而成。DeepCoder-14B-Preview基...
閱讀原文

GitHub MCP Server

GitHub MCP Server 是GitHub 官方推出的基于 Model Context Protocol (MCP) 的服務器工具,GitHub MCP Server能無縫集成 GitHub API,為開發者提供高級自動化...
閱讀原文

Nova Sonic

Nova Sonic 是亞馬遜推出的新型生成式 AI 語音模型。將語音理解與生成能力整合到一個模型中,能根據說話者的語調、風格等聲學上下文調整生成的語音響應,對話...
閱讀原文
14142434445146