一個可以在一次傳遞中生成超逼真的對話的 TTS 模型。
AIdeaFlow Podcast可讓您使用人工智能語音將任何文本轉化為高質量的播客。 您可以從 120 多種語音中進行選擇,并創建多種語言的音頻內容。
Llasa-3B 是一個基于 LLaMA 的文本到語音合成模型,支持中英文語音生成。
CSM 1B 是一個由 Sesame 開發的文本到語音生成模型,可生成高質量的音頻。
領先的文本到語音轉換模型
生成高質量中文方言語音的大規模文本到語音模型。
與大型語言模型進行自然的語音對話
輕量級端到端文本到語音模型
微軟亞洲研究院開發的語音合成技術
將任何PDF文檔轉換成播客節目。
一個擁有8200萬參數的前沿文本到語音(TTS)模型。
基于文本提示生成獨特聲音
快速構建基于AI的會話頭像
將學術論文轉換成生動的播客形式
基于MaskGCT模型的文本到語音演示
高精度環境音頻信息捕捉與生成的語音轉語音模型
一款通過純語言模型實現的文本到語音合成模型
高性能的文本到語音合成模型
快速文本轉語音引擎
一個展示Gemini 2.0原生音頻能力的實驗性文本編輯器
個性化圣誕祝福視頻制作平臺
Voice Forge是一個簡單而有趣的應用程序,可以幫助您創建和許可文本到語音音頻,使您的音樂、游戲或視頻脫穎而出。,Voice Forge官網入口網址
Voice Clone官網入口網址,MyVocal.ai_一種快速簡便的方法來克隆您的聲音以供唱歌或說話
zeroscope_v2_XL官網入口網址,管道標簽不在官方列表中
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙