Llasa-3B 是一個基于 LLaMA 的文本到語音合成模型,支持中英文語音生成。
Llasa-1B 是一個基于 LLaMA 的文本轉語音 (TTS) 模型,支持中英文語音合成。
Zonos-v0.1-hybrid 是一款領先的開源文本轉語音模型,能夠提供高質量的語音合成服務。
CSM 1B 是一個由 Sesame 開發的文本到語音生成模型,可生成高質量的音頻。
Reecho秒速克隆聲音,生成逼真自然的AI語音,賦予文本極具表現力的配音。
思必馳DFM-2大模型賦能多模態交互和行業應用,提供更智能、個性化的對話體驗。
全球首款多情緒、多語態、全可控AI配音,一鍵生成專業級語音。
ChatTTS項目的入門指南和資源匯總。
基于科大訊飛語音技術,實現智能客服的多渠道解決方案。
讓應用通過語音與文本的轉換實現智能交互。
將文本轉換為自然流暢的語音輸出
快速AI語音助手
生成高質量中文方言語音的大規模文本到語音模型。
輕量級端到端文本到語音模型
利用AI生成視頻腳本、語音和會說話的頭像
微軟亞洲研究院開發的語音合成技術
使用Llama模型的語音合成工具
高效、多語種的語音合成模型
高效化的輕量級音色定制方案
生成真實 AI 語音
使用人工智能將文本轉換為音頻
高效的文本到音頻生成模型,具有潛在一致性。
睿聲 - 超擬真瞬時語音克隆平臺
高效并行音頻生成技術
一個擁有8200萬參數的前沿文本到語音(TTS)模型。
一鍵生成帶字幕和配音的視頻翻譯工具
輕松翻譯視頻,我們的AI可以完美匹配說話者的嘴型
實時語音翻譯,跨語言溝通的橋梁。
AI驅動的視頻生成工具,一鍵生成高質量營銷視頻
可擴展的流媒體語音合成技術,結合大型語言模型。
實時對話式人工智能,一鍵式API接入。
基于MaskGCT模型的文本到語音演示
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙