AI項目和框架

Job Worth Calculator

Job Worth Calculator(工作性價比計算器)是在線工具,支持全面評估工作的實際價值,不僅僅局限于薪資水平。工具綜合考慮年薪、工作時長、通勤時間、工作環...
閱讀原文

MOSS-TTSD

MOSS-TTSD(Text to Spoken Dialogue)是開源的口語對話語音生成模型,由清華大學語音與語言實驗室(Tencent AI Lab)開發。能將文本對話腳本轉化為自然流暢...
閱讀原文

Chrome MCP Server

Chrome MCP Server是基于Chrome擴展的模型上下文協議(MCP)服務器,將Chrome瀏覽器的功能暴露給AI助手,如Claude。支持AI直接控制用戶的日常Chrome瀏覽器,...
閱讀原文

DeepSeek R1T2

DeepSeek R1T2 (DeepSeek-TNG R1T2 Chimera)是TNG基于 DeepSeek 原始模型開發的改進型人工智能語言模型。采用 Tri-Mind 架構,融合了 DeepSeek R1-0528、R1...
閱讀原文

Kyutai TTS

Kyutai TTS 是法國人工智能研究機構 Kyutai Labs 推出的流式文本轉語音(TTS)技術。是創新的語音合成系統,能實時將文本轉換為自然流暢的語音,無需等待完整...
閱讀原文

Skywork-Reward-V2

Skywork-Reward-V2是昆侖萬維開源的第二代獎勵模型系列,包含基于不同基座模型和大小的8個模型,參數規模從6億到80億不等。Skywork-Reward-V2系列模型在七大...
閱讀原文

Nxtscape

Nxtscape 是基于 Chromium 的開源瀏覽器,主打本地 AI Agent和隱私保護。Nxtscape支持用戶在設備上直接運行 AI 自動化任務(如填表、會議調度),數據不離開...
閱讀原文

MuseSteamer

MuseSteamer是百度推出的多模態AI視頻生成大模型。模型能根據輸入的圖片或文字提示,生成高質量的動態視頻,支持電影級畫質和音效一體化生成。
閱讀原文

DeepSWE

DeepSWE是Together.ai聯合Agentica開源的AI Agent框架,基于Qwen3-32B模型,用強化學習訓練而成。DeepSWE在SWE-Bench-Verified基準測試中表現出色,測試時擴...
閱讀原文

Step-Audio-AQAA

Step-Audio-AQAA 是 StepFun 團隊推出的端到端大型音頻語言模型,專門用于音頻查詢-音頻回答(AQAA)任務。能直接處理音頻輸入生成自然、準確的語音回答,無...
閱讀原文

Mercury

Mercury是由Inception Labs推出的專為聊天應用量身定制的商業級擴散(LLM)。基于“從粗到細”(coarse-to-fine)的生成過程,能并行生成多個token,顯著提高文...
閱讀原文

MirrorMe

MirrorMe是阿里通義實驗室推出的實時、高保真音頻驅動肖像動畫框架。框架基于LTX視頻模型,結合三項關鍵創新,身份注入機制、音頻驅動控制模塊和漸進式訓練策...
閱讀原文

寸止

寸止是開源的AI對話增強工具,能解決AI助手提前終止對話的問題。工具具備智能攔截功能,當AI想要結束對話時,自動彈出繼續選項,讓用戶能深入交流。寸止支持...
閱讀原文

GLM-4.1V-Thinking

GLM-4.1V-Thinking是智譜AI推出的開源視覺語言模型,專為復雜認知任務設計,支持圖像、視頻、文檔等多模態輸入。模型在GLM-4V架構基礎上引入思維鏈推理機制,...
閱讀原文

BlenderFusion

BlenderFusion是Google DeepMind推出的生成式視覺合成框架,將傳統的 3D 編輯軟件(Blender)與AI 模型相結合,實現精準的幾何編輯和多樣的視覺合成。
閱讀原文
11516171819146