標簽:文本轉語音

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

DiaMoE-TTS

DiaMoE-TTS 是清華大學和巨人網絡聯合推出的多方言語音合成(TTS)框架。框架基于國際音標(IPA)統一輸入體系,結合方言感知的 Mixture-of-Experts(MoE)架...
閱讀原文

NeuTTS Air

NeuTTS Air 是 Neuphonic 開發的超擬真、可離線運行的 TTS(文本到語音)模型。具備高擬真語音合成能力,聲音自然流暢,幾乎能以假亂真。支持本地運行,提供 ...
閱讀原文

Qwen3-TTS-Flash

Qwen3-TTS-Flash 是阿里通義推出的支持多音色、多語言和多方言的旗艦語音合成模型。模型具備卓越的中英語音穩定性,出色的多語言性能,及高表現力的擬人音色。
閱讀原文

IndexTTS2

IndexTTS2是B站語音團隊開發的新型文本轉語音(TTS)模型,已經正式開源。模型在情感表達和時長控制方面實現了重大突破,是首個支持精確時長控制的自回歸TTS...
閱讀原文

UnifiedTTS

UnifiedTTS 是提供一站式文本轉語音(TTS)服務的平臺。通過統一的 API 接口,整合了多種主流的 TTS 服務,包括 Microsoft Azure、MiniMax、阿里云和 ElevenL...
閱讀原文

Wan2.2-S2V

Wan2.2-S2V 是開源的多模態視頻生成模型,僅需一張靜態圖片和一段音頻,能生成電影級數字人視頻,視頻時長可達分鐘級,且支持多種圖片類型和畫幅。
閱讀原文

KittenTTS

KittenTTS 是輕量級開源文本轉語音(TTS)模型,由 KittenML 團隊開發。以極小的模型體積(僅 25MB)和強大的 CPU 優化為特點,無需 GPU 即可在低功耗設備上...
閱讀原文

Kyutai TTS

Kyutai TTS 是法國人工智能研究機構 Kyutai Labs 推出的流式文本轉語音(TTS)技術。是創新的語音合成系統,能實時將文本轉換為自然流暢的語音,無需等待完整...
閱讀原文

Voxiyo

Voxiyo是AI語音筆記管理應用,幫助用戶高效記錄、整理和利用語音信息。基于強大的 AI 功能,將語音筆記轉化為文字、摘要、關鍵點和待辦事項,實現一鍵生成和...
閱讀原文

Muyan-TTS

Muyan-TTS 是為播客場景設計的開源文本轉語音(TTS)模型。模型預訓練超過10萬小時的播客音頻數據,能實現零樣本語音合成,無需大量目標說話人的語音數據可生...
閱讀原文

ebook2audiobookXTTS:多語言開源電子書轉有聲書AI工具,輕松轉換16種語言的文本為生動音頻

ebook2audiobookXTTS是開源的AI工具,能將電子書轉換為有聲書。ebook2audiobookXTTS支持多種電子書格式,如epub、pdf、mobi等,用Coqui XTTS技術實現高質量的...
閱讀原文

VoicePen.ai:智能內容生成工具助你輕松創建多媒體博客文章

VoicePen.ai 是AI驅動的內容創作工具,能將音頻、視頻、語音備忘錄和網站內容快速轉換成博客文章。VoicePen.ai 用粘貼鏈接或上傳文件,自動生成引人入勝的內...
閱讀原文

Toucan TTS

Toucan TTS是由德國斯圖加特大學自然語言處理研究所(IMS)開發的文本到語音合成工具箱,支持超過7000種語言,包括多種方言和變體,提供多說話人語音合成、語...
閱讀原文

ElevenLabs Reader App

ElevenLabs Reader App是由AI語音初創公司ElevenLabs推出的一款文本轉語音應用,利用AI技術將各類文本內容,如文章、PDF文件、ePub等,轉化為自然流暢、高音...
閱讀原文

NaturalReader

NaturalReader是一款文本轉語音軟件,基于AI技術將文本文檔轉換成自然流暢的語音輸出。軟件支持50多種語言和200多種AI聲音,能處理PDF、Word文檔、電子書等20...
閱讀原文
12