標簽:多語言支持

Speakr

Speakr是開源免費的AI會議助手,支持確保數據絕對私密的前提下,自動化完成會議錄音轉寫、內容摘要提煉與智能問答。Speakr無需聯網就能運行,所有數據處理均...
閱讀原文

MonkeyOCR

MonkeyOCR 是華中科技大學聯合金山辦公(Kingsoft Office)推出的文檔解析模型,模型支持高效地將非結構化文檔內容轉換為結構化信息。基于精確的布局分析、內...
閱讀原文

SignGemma

SignGemma 是谷歌 DeepMind 團隊推出的全球最強大的手語翻譯AI模型。專注于將美國手語(ASL)翻譯成英語文本,通過多模態訓練方法,結合視覺數據和文本數據,...
閱讀原文

AI-Media2Doc

AI-Media2Doc 是開源的音視頻轉文檔工具,基于AI大模型技術,支持將音視頻內容智能轉換為小紅書筆記、公眾號文章、知識筆記、思維導圖和視頻字幕等多種文檔形...
閱讀原文

Largo

Largo是基于AI技術加速影視內容開發的創新平臺。平臺分析海量影視數據(包括超過40萬部電影和電視劇、95萬名演員、5.9萬個劇本等),為影視制作提供數據驅動...
閱讀原文

DeepSeek-R1-0528

DeepSeek-R1-0528 是 DeepSeek 團隊推出的最新版AI模型。模型基于 DeepSeek-V3-0324 訓練,參數量達 660B。模型在 HuggingFace 上開源,開發者能自由使用和修...
閱讀原文

Ming-lite-omni

Ming-Lite-Omni是螞蟻集團開源的統一多模態大模型。模型基于MoE架構,融合文本、圖像、音頻和視頻等多種模態的感知能力,具備強大的理解和生成能力。模型在多...
閱讀原文

Jodi

Jodi是中國科學院計算技術研究所和中國科學院大學推出的擴散模型框架,基于聯合建模圖像域和多個標簽域,將視覺生成與理解統一起來。
閱讀原文

PC Agent-E

PC Agent-E是上海交通大學和SII聯合推出的高效智能體訓練框架。框架用312條人類標注的計算機使用軌跡,基于Claude 3.7 Sonnet模型合成多樣化的行動決策,顯著...
閱讀原文

YouWare

YouWare 是明超平(Leon Ming)創立的AI編程社區平臺。幫助用戶通過AI Coding將創意轉化為作品,降低編程門檻。用戶只需用自然語言描述需求,AI能生成代碼,...
閱讀原文

QwenLong-L1

QwenLong-L1-32B 是阿里巴巴集團 Qwen-Doc 團隊推出的,基于強化學習訓練的首個長文本推理大模型。模型基于漸進式上下文擴展、課程引導的強化學習和難度感知...
閱讀原文

xbench

xbench是紅杉中國推出的全新的AI基準測試工具。基于雙軌評估體系,構建多維度測評數據集,追蹤模型的理論能力上限與Agent的實際落地價值。xbench用長青評估機...
閱讀原文

Kilo Code

Kilo Code 是開源的VS Code AI Agent擴展程序,提升開發人員的編碼效率。具備強大的代碼生成能力,能根據自然語言描述快速生成代碼片段,有效減少手動編寫代...
閱讀原文

VideoTutor

VideoTutor是AI教育輔助工具,生成動畫講解視頻,幫助學生理解知識點和解題過程。VideoTutor支持SAT數學、AP數學、STEM知識和語言學習等學科領域。
閱讀原文

Aurora

Aurora是微軟研究院推出的13億參數的大氣基礎模型,基于從海量大氣數據中提取有價值信息,用在預測全球天氣模式、空氣污染和海洋波浪等大氣過程。模型用預訓...
閱讀原文
123462