標簽:多語言支持

ConFiner

ConFiner 是一個創新的視頻生成框架,由多所大學和研究機構共同推出。結合多個現成的擴散模型專家,無需額外訓練可生成高質量且連貫的視頻內容。

M2UGen

M2UGen是先進的多模態音樂理解和生成框架,由騰訊PCG ARC實驗室與新加坡國立大學聯合推出。結合了大型語言模型(LLM)的能力,能處理包括文本、圖像、視頻和...
閱讀原文

Speechnotes

Speechnotes是AI驅動的在線語音轉文字工具,支持音頻和視頻轉錄、翻譯及語音輸入筆記。具備語音命令、自動大寫、易于導入導出等特點,提供便捷的口述和轉錄體...
閱讀原文

Nemotron-Mini-4B-Instruct

Nemotron-Mini-4B-Instruct是英偉達推出的一款開源小型語言模型,專為角色扮演、檢索增強生成(RAG)和函數調用任務優化。模型通過蒸餾、剪枝和量化技術優化...
閱讀原文

E2B

E2B 是致力于構建自動化云平臺的開發者工具輔助平臺,專注于為AI代理和應用程序開發開源代碼解釋層。E2B 提供支持多種大型語言模型(LLM)和AI框架的基礎設施...
閱讀原文

Sudo AI

Sudo AI 是一個基于AI技術提供3D模型生成服務的平臺,通過文本或圖像輸入快速創建3D模型,主要服務于游戲領域的模型創建。平臺以高效、易用和創新技術,降低...
閱讀原文

Faster Whisper

Faster Whisper 是一個基于OpenAI Whisper模型的高效語音識別工具,運用CTranslate2引擎實現快速推理。在保持高準確度的同時,提升語音轉寫速度,降低內存使...
閱讀原文

Qwen2.5-Coder

Qwen2.5-Coder 是阿里Qwen 團隊推出的全系列代碼生成模型,推動開源代碼語言模型的發展。在代碼生成、代碼推理、代碼修復等任務上表現出色。系列涵蓋了不同規...
閱讀原文

Qwen2.5

Qwen2.5 是阿里通義千問團隊最新開源的最強AI大模型,具有多種參數規模的模型,包括 0.5B、1.5B、3B、7B、14B、32B 和 72B。模型在預訓練時使用了最新的大規...
閱讀原文

AI Hugging

AI Hugging 是一個基于AI技術的在線平臺,用戶通過上傳照片或輸入文字描述來創建個性化的擁抱視頻。使用先進的AI算法分析圖像中的人物,將靜態照片轉化為動態...
閱讀原文

Ovis1.6

Ovis1.6是阿里國際AI團隊推出的多模態大模型,在多模態權威綜合評測基準OpenCompass上取得了優異的成績,特別是在30億參數以下的模型中綜合得分排名第一,超...
閱讀原文

Tripo 2.0

Tripo 2.0 是 VAST 公司推出的一款創新的 3D 模型生成服務,融合 DiT 和 U-Net 模型的復合架構,能快速生成具有豐富細節和高質量材質的 3D 模型。Tripo 2.0的...
閱讀原文

Videotoword.ai

Videotowords.ai是一款AI驅動的在線服務,能將視頻和音頻文件轉換成文字。基于先進的語音識別技術,支持多達98種語言的轉錄,提供自動生成摘要、快速準確的轉...
閱讀原文

RushChat AI

RushChat AI 是一個先進的對話式AI平臺,專注于提供沉浸式和個性化的聊天體驗。基于自然語言處理和機器學習技術,支持用戶與定制的AI角色進行逼真的對話。
閱讀原文

Toorch

Toorch是由零一萬物推出的一款AI新聞閱讀器,旨在提供高效、個性化的移動搜索體驗。支持連續對話功能,形成時間線結構,方便用戶追蹤和回顧歷史對話。
閱讀原文
1454647484961