一個簡單易用的語音克隆和語音模型訓練工具。
AI配音全能平臺,千種真人音色,二次元創作利器。
VoiceCanvas是一款領先的AI語音克隆和文本轉語音(TTS)工具,支持40+種語言,提供高保真語音合成、實時文本轉語音、個性化聲紋克隆等功能。
靈云開放平臺免費提供全面的智能人機交互技術,包括語音合成、識別,手寫識別,光學字符識別,語義理解,機器翻譯等,助力移動應用、智能硬件實現自然、智能的交互。
開發者可互動體驗 OpenAI API 中的新語音模型gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。
免費的文字生成語音網站,包含各種方言(東北話、陜西話、粵語、閩南語)
訊飛智作是一款集AI配音、虛擬人視頻生成、PPT生成視頻、虛擬人定制等多功能的AI音視頻生產平臺。已廣泛應用于媒體、教育、短視頻等領域。
靈云AI開放平臺
科大訊飛推出的移動互聯網智能交互平臺,為開發者免費提供:涵蓋語音能力增強型SDK,一站式人機智能語音交互解決方案,專業全面的移動應用分析;
海螺AI推出的AI語音生成工具,支持多種語種、情緒和效果。
一個開源文本轉語音系統,致力于實現人類語音的自然化。
Synexa是一個簡單、快速且穩定的AI服務平臺,通過簡單的一行代碼就能部署和運行AI模型。支持圖像生成、視頻生成、語音合成等,幫助開發者輕松集成AI能力,提升工作效率。
將電子書轉換為有聲書的工具。
基于Kokoro和ONNX運行時的文本到語音(TTS)項目。
LLaSA: 擴展基于 LLaMA 的語音合成的訓練時間和測試時間計算量
基于Llama框架的TTS基礎模型,兼容16萬小時標記化語音數據。
Sesame AI 是一款先進的語音合成平臺,能夠生成自然對話式語音并具備情感智能。
一個用于生成對話式語音的模型,支持從文本和音頻輸入生成高質量的語音。
AI ContentCraft 是一個多功能內容創作工具,集成了文本生成、語音合成和圖像生成能力。
Llasa-3B 是一個基于 LLaMA 的文本到語音合成模型,支持中英文語音生成。
Llasa-1B 是一個基于 LLaMA 的文本轉語音 (TTS) 模型,支持中英文語音合成。
Zonos-v0.1-hybrid 是一款領先的開源文本轉語音模型,能夠提供高質量的語音合成服務。
CSM 1B 是一個由 Sesame 開發的文本到語音生成模型,可生成高質量的音頻。
Reecho秒速克隆聲音,生成逼真自然的AI語音,賦予文本極具表現力的配音。
思必馳DFM-2大模型賦能多模態交互和行業應用,提供更智能、個性化的對話體驗。
全球首款多情緒、多語態、全可控AI配音,一鍵生成專業級語音。
ChatTTS項目的入門指南和資源匯總。
基于科大訊飛語音技術,實現智能客服的多渠道解決方案。
讓應用通過語音與文本的轉換實現智能交互。
將文本轉換為自然流暢的語音輸出
快速AI語音助手
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙