AI項目和框架

Jamba Reasoning 3B

Jamba Reasoning 3B 是 AI21 Labs 推出的輕量級高效推理模型,擁有 30 億參數和 256K 的超長上下文處理能力。模型用混合 Transformer-Mamba 架構,結合注意力...
閱讀原文

UserLM-8b

UserLM-8b是微軟推出的用戶語言模型(User Language Model),專門用在模擬對話中的“用戶”角色,不是常見的“助手”角色。
閱讀原文

Imagine v0.9

Imagine v0.9 是 xAI 公司推出的最新視頻生成模型。模型能在不到20秒內生成6秒左右的視頻,支持運動控制、動態相機效果、自然對話添加等功能,且配備語音優先...
閱讀原文

OpenAgents

OpenAgents 是用在構建AI Agent網絡的開源框架,將Agent連接到網絡實現開放式協作。框架通過創建持久化的Agent網絡,讓Agent能像人類一樣長期在線、相互協作...
閱讀原文

Ling-1T

Ling-1T 是螞蟻集團開源的萬億參數語言模型,定位為“旗艦級非思考模型”。基于 MoE(Mixture of Experts)架構,擁有 1 萬億參數,每次推理激活約 510 億參數...
閱讀原文

Gemini 2.5 Computer Use

Gemini 2.5 Computer Use 是谷歌 DeepMind 推出的基于 Gemini 2.5 的計算機使用模型。模型能讓 AI 直接控制瀏覽器,執行點擊、滾動和輸入等操作。
閱讀原文

DeepScientist

DeepScientist 是西湖大學等機構提出的自主科研系統,實現從假設生成到實驗驗證、再到結果分析與論文撰寫的全流程自動化。通過多智能體架構與強化學習策略,...
閱讀原文

SceneGen

SceneGen是上海交通大學研究團隊開發的高效開源3D場景生成框架。能從單張場景圖像及其對應的物體分割掩碼出發,通過一次前向傳播,直接生成包含完整幾何結構...
閱讀原文

Ming-UniAudio

Ming-UniAudio 是螞蟻集團開源的音頻多模態模型,統一語音理解、生成和編輯任務。核心是 MingTok-Audio,一個基于 VAE 框架和因果 Transformer 架構的連續語...
閱讀原文

Agent Kit

Agent Kit 是 OpenAI 推出的一套完整的智能體開發工具包,幫助開發者將 AI 代理從原型快速推進至生產環境。包含三大核心組件:Agent Builder可視化畫布工具,...
閱讀原文

Code2Video

Code2Video是新加坡國立大學Show Lab團隊開發的AI教學視頻生成框架,通過Python代碼自動生成高質量教育視頻。核心創新在于采用三智能體協作模式:Planner負責...
閱讀原文

OpenLens AI

OpenLens AI 是清華大學自動化系推出的專為醫學研究設計的全自主人工智能研究助手,通過多智能體協作,實現從文獻綜述、實驗設計、數據分析到論文生成的全流...
閱讀原文

ReceiptHero

ReceiptHero 是開源的 AI 記賬工具,能通過拍照將收據快速轉化為數字化賬單。工具基于先進的 AI 圖像識別技術,用高達 95% 的準確率提取收據上的日期、金額、...
閱讀原文

AIMangaStudio

AIMangaStudio是開源的AI漫畫創作工具,為創作者提供了一套完整的漫畫創作流水線,包括劇情生成、分鏡設計、角色設定等功能,能簡化從腳本到漫畫頁面的制作流...
閱讀原文

TRUEBench

TRUEBench(Trustworthy Real-world Usage Evaluation Benchmark)是三星電子推出的 AI 基準測試工具,用在評估人工智能在實際工作場景中的生產力,解決現有A...
閱讀原文
156789154