一個(gè)可以在一次傳遞中生成超逼真的對(duì)話的 TTS 模型。
AIdeaFlow Podcast可讓您使用人工智能語(yǔ)音將任何文本轉(zhuǎn)化為高質(zhì)量的播客。 您可以從 120 多種語(yǔ)音中進(jìn)行選擇,并創(chuàng)建多種語(yǔ)言的音頻內(nèi)容。
Llasa-3B 是一個(gè)基于 LLaMA 的文本到語(yǔ)音合成模型,支持中英文語(yǔ)音生成。
CSM 1B 是一個(gè)由 Sesame 開(kāi)發(fā)的文本到語(yǔ)音生成模型,可生成高質(zhì)量的音頻。
領(lǐng)先的文本到語(yǔ)音轉(zhuǎn)換模型
生成高質(zhì)量中文方言語(yǔ)音的大規(guī)模文本到語(yǔ)音模型。
與大型語(yǔ)言模型進(jìn)行自然的語(yǔ)音對(duì)話
輕量級(jí)端到端文本到語(yǔ)音模型
微軟亞洲研究院開(kāi)發(fā)的語(yǔ)音合成技術(shù)
將任何PDF文檔轉(zhuǎn)換成播客節(jié)目。
一個(gè)擁有8200萬(wàn)參數(shù)的前沿文本到語(yǔ)音(TTS)模型。
基于文本提示生成獨(dú)特聲音
快速構(gòu)建基于AI的會(huì)話頭像
將學(xué)術(shù)論文轉(zhuǎn)換成生動(dòng)的播客形式
基于MaskGCT模型的文本到語(yǔ)音演示
高精度環(huán)境音頻信息捕捉與生成的語(yǔ)音轉(zhuǎn)語(yǔ)音模型
一款通過(guò)純語(yǔ)言模型實(shí)現(xiàn)的文本到語(yǔ)音合成模型
高性能的文本到語(yǔ)音合成模型
快速文本轉(zhuǎn)語(yǔ)音引擎
一個(gè)展示Gemini 2.0原生音頻能力的實(shí)驗(yàn)性文本編輯器
個(gè)性化圣誕祝福視頻制作平臺(tái)
Voice Forge是一個(gè)簡(jiǎn)單而有趣的應(yīng)用程序,可以幫助您創(chuàng)建和許可文本到語(yǔ)音音頻,使您的音樂(lè)、游戲或視頻脫穎而出。,Voice Forge官網(wǎng)入口網(wǎng)址
Voice Clone官網(wǎng)入口網(wǎng)址,MyVocal.ai_一種快速簡(jiǎn)便的方法來(lái)克隆您的聲音以供唱歌或說(shuō)話
zeroscope_v2_XL官網(wǎng)入口網(wǎng)址,管道標(biāo)簽不在官方列表中
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙