標簽:多語言支持

日日新SenseNova V6

日日新SenseNova V6是商湯推出的日日新第六代多模態融合大模型系列,基于6000億參數的多模態MoE架構,實現文本、圖像和視頻的原生融合。日日新SenseNova V6在...
閱讀原文

MoLing

MoLing 是無依賴的本地辦公自動化助手,是基于計算機和瀏覽器使用的 MCP 服務器。MoLing 基于操作系統 API 實現系統交互,支持文件系統操作(如讀寫、合并、...
閱讀原文

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高效、低延遲的 AI 模型,基于 Gemini 2.5 模型構建。Gemini 2.5 Flash在保持低延遲和成本效益的同時,引入思考能力。
閱讀原文

Lipsync-2

Lipsync-2 是 Sync Labs 推出的全球首個零-shot 嘴型同步模型。無需針對特定演講者進行預訓練,能即時學習并生成符合獨特說話風格的嘴型同步效果。
閱讀原文

Llama Nemotron

Llama Nemotron是NVIDIA推出的一系列推理模型,專注于推理和多種智能代理(agentic AI)任務。模型基于Llama開源模型,經過NVIDIA的后訓練,加入推理能力,在...
閱讀原文

Dream-7B

Dream-7B是香港大學和華為諾亞方舟實驗室聯合推出的擴散式推理模型,是目前最強大的開源擴散大語言模型。Dream-7B訓練數據涵蓋文本、數學和代碼,預訓練使用5...
閱讀原文

DeepCoder-14B-Preview

DeepCoder-14B-Preview 是 Agentica 和 Together AI 聯合開源的大型代碼生成模型,基于 Deepseek-R1-Distilled-Qwen-14B 微調而成。DeepCoder-14B-Preview基...
閱讀原文

Step-R1-V-Mini

Step-R1-V-Mini 是階躍星辰最新推出的多模態推理模型。支持圖文輸入和文字輸出,具備良好的指令遵循和通用能力,能高精度感知圖像完成復雜推理任務。模型在視...
閱讀原文

Llama 4

Llama 4 是 Meta 推出的多模態人工智能模型。首次采用混合專家(MoE)架構,在訓練和推理時計算效率更高。Llama 4 目前有 Scout 和 Maverick 兩個版本。Scout...
閱讀原文

OmniTalker

OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...

DeepSeek-GRM

DeepSeek-GRM是DeepSeek和清華大學研究者共同提出的通用獎勵模型(Generalist Reward Modeling)。通過點式生成式獎勵建模(Pointwise Generative Reward Mod...
閱讀原文

OlympicArena

OlympicArena是上海交通大學、上海AI Lab、蘇州大學和上海交通大學生成式人工智能實驗室(GAIR Lab)聯合推出的多學科認知推理基準測試框架。OlympicArena包...
閱讀原文

BabelDOC

BabelDOC 是開源的智能 PDF 翻譯工具,專為科學論文翻譯設計。能在原文旁生成翻譯文本,形成雙語對照,無需切換窗口,方便閱讀。能完整保留數學公式、表格和...

枝頁

枝頁(iBleaf)是基于金字塔原理設計的AI筆記工具,幫助用戶將碎片化的知識整理成清晰有序的知識體系。通過知識樹的形式,讓用戶能以層級化的結構組織筆記,...
閱讀原文

面靈AI

面靈AI是基于DeepSeek大模型的AI面試助手,專為求職者設計,提升面試表現。具備實時面試輔助功能,能在面試中快速解析問題并給出專業回答建議,能根據簡歷和...
閱讀原文
18910111262