標簽:多語言支持

All Voice Lab

All Voice Lab(趣丸千音)是全球領先的AI語音創作平臺,提供一站式智能語音解決方案,基于趣丸科技與香港中文大學(深圳)聯合研發的MaskGCT語音大模型開發...
閱讀原文

Dreamona

Dreamona 是 AI 視頻生成工具,用戶基于簡單的文字描述或上傳圖片,快速生成高質量的動態視頻。Dreamona 支持多種視頻風格,從現實主義到創意動畫,滿足不同...
閱讀原文

olmOCR

olmOCR 是 Ai2 推出的開源工具,用在將 PDF 文檔高效轉換為干凈的結構化純文本。olmOCR結合文檔錨定(document-anchoring)技術與Qwen2-VL-7B-Instruct(阿里...
閱讀原文

Flame

Flame是開源的多模態AI模型,支持將UI設計截圖轉換為高質量的現代前端代碼。Flame基于視覺語言建模、自動化數據合成和結構化訓練流程,生成符合React等現代前...
閱讀原文

Gemini Code Assist

Gemini Code Assist 是 Google 推出的 AI 編程工具,能幫助開發者更高效地編寫代碼、提升代碼質量。Gemini Code Assist 基于 Gemini 2.0 模型,支持所有公開...
閱讀原文

元鏡

元鏡是基于人機共生引擎的AI視頻創作系統,支持從創意靈感到成品視頻實現高效創作。元鏡基于自動化腳本生成、角色風格統一、多模態融合和智能工作流等功能,...
閱讀原文

LazyLLM

LazyLLM 是開源的低代碼平臺,幫助開發者快速、低成本地構建多智能體大語言模型應用。通過極簡的開發流程,支持一鍵式部署和跨平臺操作,降低了 AI 應用開發...
閱讀原文

SigLIP 2

SigLIP 2 是Google DeepMind 提出先進的多語言視覺-語言模型 ,是 SigLIP 的升級版本,提升圖像與文本之間的對齊能力。通過改進的訓練方法和架構,顯著增強了...
閱讀原文

優雅YOYA

優雅(YOYA)是中科聞歌推出的多模態文生視頻平臺,通過AI多模態技術賦能視頻內容創作全鏈路。平臺以大語言模型和多模態大模型為核心,支持文本生成視頻、圖...
閱讀原文

FlashMLA

FlashMLA 是 DeepSeek 開源的針對 NVIDIA Hopper 架構 GPU 優化的高效 MLA(Multi-Head Linear Attention)解碼內核,專為處理可變長度序列設計。通過優化 KV...
閱讀原文

MagicArticulate

MagicArticulate 是南洋理工大學和字節跳動Seed實驗室推出的自動將靜態 3D 模型轉換為可動畫化資產的框架。MagicArticulate基于自回歸生成骨架,預測蒙皮權重...
閱讀原文

Argon

Argon 是專注于為制藥、生物技術和生命科學行業提供自動化和增強臨床開發的智能解決方案平臺。平臺通過自然語言處理和專有數據庫,能快速分析臨床試驗、生成...
閱讀原文

Miss Dora

Miss Dora是AI兒童英文閱讀應用,為3-8歲兒童提供AI互動故事。Miss Dora基于個性化的故事講述和互動問答,激發孩子的閱讀興趣和想象力,能提升語言能力和思維...
閱讀原文

Llasa TTS

Llasa TTS 是香港科技大學基于 LLaMA 架構推出的開源文本轉語音(TTS)模型,支持高質量語音合成和克隆。Llasa TTS 基于單層向量量化(VQ)編解碼器和單個 Tr...
閱讀原文

Indic Parler-TTS

Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 團隊合作推出的多語言文本到語音(TTS)模型,專門用于印度語言和英語的語音合成。Indic Parler-TTS 是 Parl...
閱讀原文
1151617181961