AI項目和框架

OneCAT

OneCAT是美團推出的新型統一多模態模型,采用純解碼器架構,能無縫集成多模態理解、文本到圖像生成和圖像編輯功能。模型摒棄了傳統多模態模型中依賴外部視覺...
閱讀原文

mobile-use

mobile-use是移動端AI Agents工具,支持自然語言控制Android和iOS設備,幫助用戶操作手機。用戶用日常語言下達指令,工具自動完成任務,如打開應用、填寫表單...
閱讀原文

InfinityHuman

InfinityHuman 是字節跳動與浙江大學聯合團隊推出的商用級長時序音頻驅動人物視頻生成模型,開啟 AI 數字人實用化新篇章。
閱讀原文

Super Agent Party

Super Agent Party 是開源的3D AI桌面伴侶軟件,將桌寵、智能助手、知識庫、機器人控制等多種功能集于一體。用戶能通過Docker或源碼快速部署到Windows、macOS...
閱讀原文

Kimi K2-0905

Kimi K2-0905是月之暗面科技有限公司推出的AI大模型最新版本。模型在原有基礎上進行增強,特別是在編程能力上,支持高達256K的上下文長度,遠超之前的128K。
閱讀原文

Apertus

Apertus是瑞士EPFL、ETH Zurich和瑞士國家超級計算中心(CSCS)聯合推出的瑞士首個大規模開放、多語言的大型語言模型,有70B和8B兩個參數版本。
閱讀原文

RealDevWorld

RealDevWorld 是 MetaGPT 團隊開發的新一代自動化測試工具。基于多智能體框架,通過模擬真實開發團隊的工作流程,將需求分析、測試用例生成、代碼調試到最終...
閱讀原文

Prompt Tools

Prompt Tools 是開源的桌面應用程序,能幫助用戶高效管理 AI 提示詞(Prompt)。工具支持跨平臺運行(Windows、macOS、Linux),提供快速、安全的體驗。
閱讀原文

編碼面試解題助手

編碼面試解題助手是面向中文用戶的編程輔助工具,能通過快捷鍵抓取屏幕上的編程題目,實時借助AI生成解題思路和代碼。
閱讀原文

USO

USO(Unified Style-Subject Optimized)是字節跳動 UXO 團隊推出的 AI 繪畫模型。能將任何主題與任何風格在任何場景中自由組合,生成具有高度主體一致性、強...
閱讀原文

AgentScope 1.0

AgentScope 1.0 是阿里通義開源的多智能體開發框架,通過三層技術架構,AgentScope核心框架、AgentScope Runtime 和 AgentScope Studio,提供從開發到部署的...
閱讀原文

HunyuanWorld-Voyager

HunyuanWorld-Voyager(簡稱混元Voyager)是騰訊推出的業界首個支持原生3D重建的超長漫游世界模型。是新穎的視頻擴散框架,能從單張圖片生成用戶定義相機路徑...
閱讀原文

AudioStory

AudioStory 是騰訊 ARC 實驗室發布的音頻生成技術,能根據自然語言描述生成高質量的長篇敘事音頻。采用分而治之策略,將復雜敘事請求拆解為有序子任務,通過...
閱讀原文

Open-Fiesta

Open-Fiesta 是開源的多模型 AI 聊天平臺,基于 Next.js 14 構建。平臺支持多種 AI 提供商(如 Gemini、OpenRouter 等)和多種模型,用戶能同時選擇 5 種模型...
閱讀原文

Step-Audio 2 mini

Step-Audio 2 mini 是階躍星辰發布的開源端到端語音大模型。突破傳統語音模型結構,采用真端到端多模態架構,直接將原始音頻輸入轉化為語音響應輸出,時延更...
閱讀原文
156789145