AI項目和框架

KoalaQA

KoalaQA 是AI大模型驅動的開源售后服務社區,支持智能問答、語義搜索和自動運營等功能。KoalaQA 能幫助團隊實現 7×24 小時服務,顯著降低人工成本,提升客戶...
閱讀原文

DeepSeek-OCR

DeepSeek-OCR 是 DeepSeek 團隊推出的視覺語言模型,專注于通過光學壓縮技術高效處理長文本內容。模型由 DeepEncoder 編碼器和 DeepSeek3B-MoE 解碼器組成,...
閱讀原文

Dexter

Dexter 是自主金融研究智能代理(Agent),專為處理復雜金融問題而設計。工具能將復雜查詢分解為清晰的分步驟研究計劃,通過實時市場數據進行分析。
閱讀原文

PaddleOCR-VL

PaddleOCR-VL是百度飛槳團隊開源的多模態文檔解析模型,參數量僅0.9B,專為低算力設備優化。在國際權威評測OmnidocBench V1.5中以92.6分登頂全球第一,超越GP...
閱讀原文

Coral NPU

Coral NPU 是谷歌推出的全棧開源AI平臺,專為低功耗邊緣設備(如智能手表、AR 眼鏡等)設計,能解決性能、碎片化和隱私三大挑戰。Coral NPU基于 RISC-V 指令...
閱讀原文

LongCat-Audio-Codec

LongCat-Audio-Codec 是美團 LongCat 團隊開源的語音編解碼方案,專為語音大語言模型(Speech LLM)設計。通過語義和聲學雙 Token 并行提取機制,兼顧語音的...
閱讀原文

RTFM

RTFM(Real-Time Frame Model)是李飛飛團隊推出的實時生成式世界模型。模型能在單塊H100 GPU上運行,實時生成3D場景,支持持久交互。
閱讀原文

UniPixel

UniPixel是香港理工大學和騰訊ARC Lab團隊開發的首個統一像素級多模態大模型,專注于圖像/視頻的精細理解與交互。能在單個模型中完成對象指代、像素級分割和...
閱讀原文

豆包語音2.0

豆包語音2.0是字節跳動推出的升級版語音合成模型,包含兩大核心模型:豆包語音合成模型2.0(Doubao-Seed-TTS 2.0)和豆包聲音復刻模型2.0(Doubao-Seed-ICL 2...
閱讀原文

豆包大模型1.6 lite

豆包大模型1.6 Lite(Doubao-Seed-1.6-lite)是字節跳動推出的輕量級人工智能模型。模型相比旗艦版豆包1.6更輕量、推理速度更快,性價比更高。
閱讀原文

DiaMoE-TTS

DiaMoE-TTS 是清華大學和巨人網絡聯合推出的多方言語音合成(TTS)框架??蚣芑趪H音標(IPA)統一輸入體系,結合方言感知的 Mixture-of-Experts(MoE)架...
閱讀原文

Claude Haiku 4.5

Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在編碼性能上與之前的旗艦模型 Claude Sonnet 4 相當,且在某些任務中表現...
閱讀原文

Pyscn

Pyscn 是專為 Python 開發者設計的智能代碼質量分析工具,幫助開發者快速發現并清理代碼中的問題,如死代碼、重復代碼、復雜代碼結構等。通過控制流圖(CFG)...
閱讀原文

Local-NotebookLM

Local-NotebookLM 是開源的本地 AI 工具,能將 PDF 文檔轉換為引人入勝的音頻內容,如播客、訪談、辯論等。支持多種輸出格式和內容風格,用戶可以根據需求選...
閱讀原文

FS-DFM

FS-DFM(Few-Step Discrete Flow-Matching)是蘋果聯合俄亥俄州立大學推出的用在快速生成長文本的擴散語言模型。
閱讀原文
134567154