AI項目和框架
DeepSeek-OCR
DeepSeek-OCR 是 DeepSeek 團隊推出的視覺語言模型,專注于通過光學壓縮技術高效處理長文本內容。模型由 DeepEncoder 編碼器和 DeepSeek3B-MoE 解碼器組成,...
PaddleOCR-VL
PaddleOCR-VL是百度飛槳團隊開源的多模態文檔解析模型,參數量僅0.9B,專為低算力設備優化。在國際權威評測OmnidocBench V1.5中以92.6分登頂全球第一,超越GP...
LongCat-Audio-Codec
LongCat-Audio-Codec 是美團 LongCat 團隊開源的語音編解碼方案,專為語音大語言模型(Speech LLM)設計。通過語義和聲學雙 Token 并行提取機制,兼顧語音的...
豆包大模型1.6 lite
豆包大模型1.6 Lite(Doubao-Seed-1.6-lite)是字節跳動推出的輕量級人工智能模型。模型相比旗艦版豆包1.6更輕量、推理速度更快,性價比更高。
DiaMoE-TTS
DiaMoE-TTS 是清華大學和巨人網絡聯合推出的多方言語音合成(TTS)框架??蚣芑趪H音標(IPA)統一輸入體系,結合方言感知的 Mixture-of-Experts(MoE)架...
Claude Haiku 4.5
Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在編碼性能上與之前的旗艦模型 Claude Sonnet 4 相當,且在某些任務中表現...
Local-NotebookLM
Local-NotebookLM 是開源的本地 AI 工具,能將 PDF 文檔轉換為引人入勝的音頻內容,如播客、訪談、辯論等。支持多種輸出格式和內容風格,用戶可以根據需求選...
粵公網安備 44011502001135號