標簽:多語言支持
Actor Mode
Actor Mode 是 ElevenLabs 推出的AI語音生成工具,支持用戶通過自己的聲音指導 AI 生成語音內容。用戶只需錄制一段音頻或上傳已有音頻文件,AI 能分析其語調...
OpenDeepSearch
OpenDeepSearch 是開源的深度搜索工具,基于開源推理模型和推理代理提升搜索性能,專為? Hugging Face 的 SmolAgents 無縫集成進行優化,支持深度網絡搜索和...
PaddleSpeech
PaddleSpeech 是百度飛槳團隊開源的語音處理工具,提供全面的語音處理功能,包括語音識別、語音合成、聲紋識別、語音翻譯等。PaddleSpeech提供命令行界面、服...
ModelEngine
ModelEngine 是華為開源的全流程 AI 開發工具鏈,圍繞數據使能、模型使能和應用使能三大核心功能展開,解決 AI 行業化落地過程中數據工程耗時長、模型訓練和...
Ideogram 3.0
Ideogram 3.0 是Ideogram推出的 AI 圖像生成模型。Ideogram 3.0在圖像生成質量上實現飛躍,具備高度的真實感、出色的文本渲染和強大的語言理解能力,支持生成...
Qwen2.5-Omni
Qwen2.5-Omni 是阿里開源的 Qwen 系列旗艦級多模態模型,擁有7B參數,Qwen2.5-Omni具備強大的多模態感知能力,能處理文本、圖像、音頻和視頻輸入,支持流式文...
Cosmos-Reason1
Cosmos-Reason1 是 NVIDIA 推出的一系列多模態大型語言模型,基于物理常識和具身推理理解物理世界。Cosmos-Reason1包括兩個模型:Cosmos-Reason1-8B 和 Cosmo...
Browseragent
Browseragent是基于瀏覽器的AI自動化工具,直接在瀏覽器中創建和運行AI工作流,無需API調用費用,實現零成本的無限次執行。Browseragent基于無代碼可視化編輯...