標(biāo)簽：文本轉(zhuǎn)語(yǔ)音

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經(jīng)常用來(lái)日常寫(xiě)作，雖然本身提供了AI功能，但可惜需要會(huì)員，本文教你三分鐘接入最火的DeepSeek，讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址：http:/...

閱讀原文

AI教程

10個(gè)月前

AI賺錢(qián)副業(yè)~AI生成影視解說(shuō)，半個(gè)月漲粉變現(xiàn)3.5W+！

這兩年大家都在感嘆生活不易，然而我想說(shuō)的是，機(jī)會(huì)還是有的，但問(wèn)題不在于有沒(méi)有，而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì)，然后抓住它。接觸過(guò)很多咨詢(xún)項(xiàng)目的人，發(fā)現(xiàn)...

使用教程

1年前 (2024)

DiaMoE-TTS

DiaMoE-TTS 是清華大學(xué)和巨人網(wǎng)絡(luò)聯(lián)合推出的多方言語(yǔ)音合成（TTS）框架。框架基于國(guó)際音標(biāo)（IPA）統(tǒng)一輸入體系，結(jié)合方言感知的 Mixture-of-Experts（MoE）架...

閱讀原文

AI工具

2個(gè)月前

NeuTTS Air

NeuTTS Air 是 Neuphonic 開(kāi)發(fā)的超擬真、可離線運(yùn)行的 TTS（文本到語(yǔ)音）模型。具備高擬真語(yǔ)音合成能力，聲音自然流暢，幾乎能以假亂真。支持本地運(yùn)行，提供 ...

閱讀原文

AI工具

2個(gè)月前

Qwen3-TTS-Flash

Qwen3-TTS-Flash 是阿里通義推出的支持多音色、多語(yǔ)言和多方言的旗艦語(yǔ)音合成模型。模型具備卓越的中英語(yǔ)音穩(wěn)定性，出色的多語(yǔ)言性能，及高表現(xiàn)力的擬人音色。

閱讀原文

AI工具

3個(gè)月前

IndexTTS2

IndexTTS2是B站語(yǔ)音團(tuán)隊(duì)開(kāi)發(fā)的新型文本轉(zhuǎn)語(yǔ)音（TTS）模型，已經(jīng)正式開(kāi)源。模型在情感表達(dá)和時(shí)長(zhǎng)控制方面實(shí)現(xiàn)了重大突破，是首個(gè)支持精確時(shí)長(zhǎng)控制的自回歸TTS...

閱讀原文

AI工具

3個(gè)月前

UnifiedTTS

UnifiedTTS 是提供一站式文本轉(zhuǎn)語(yǔ)音（TTS）服務(wù)的平臺(tái)。通過(guò)統(tǒng)一的 API 接口，整合了多種主流的 TTS 服務(wù)，包括 Microsoft Azure、MiniMax、阿里云和 ElevenL...

閱讀原文

AI工具

3個(gè)月前

Wan2.2-S2V

Wan2.2-S2V 是開(kāi)源的多模態(tài)視頻生成模型，僅需一張靜態(tài)圖片和一段音頻，能生成電影級(jí)數(shù)字人視頻，視頻時(shí)長(zhǎng)可達(dá)分鐘級(jí)，且支持多種圖片類(lèi)型和畫(huà)幅。

閱讀原文

AI工具

4個(gè)月前

KittenTTS

KittenTTS 是輕量級(jí)開(kāi)源文本轉(zhuǎn)語(yǔ)音（TTS）模型，由 KittenML 團(tuán)隊(duì)開(kāi)發(fā)。以極小的模型體積（僅 25MB）和強(qiáng)大的 CPU 優(yōu)化為特點(diǎn)，無(wú)需 GPU 即可在低功耗設(shè)備上...

閱讀原文

AI工具

4個(gè)月前

Kyutai TTS

Kyutai TTS 是法國(guó)人工智能研究機(jī)構(gòu) Kyutai Labs 推出的流式文本轉(zhuǎn)語(yǔ)音（TTS）技術(shù)。是創(chuàng)新的語(yǔ)音合成系統(tǒng)，能實(shí)時(shí)將文本轉(zhuǎn)換為自然流暢的語(yǔ)音，無(wú)需等待完整...

閱讀原文

AI工具

5個(gè)月前

Voxiyo

Voxiyo是AI語(yǔ)音筆記管理應(yīng)用，幫助用戶(hù)高效記錄、整理和利用語(yǔ)音信息。基于強(qiáng)大的 AI 功能，將語(yǔ)音筆記轉(zhuǎn)化為文字、摘要、關(guān)鍵點(diǎn)和待辦事項(xiàng)，實(shí)現(xiàn)一鍵生成和...

閱讀原文

AI工具

6個(gè)月前

Muyan-TTS

Muyan-TTS 是為播客場(chǎng)景設(shè)計(jì)的開(kāi)源文本轉(zhuǎn)語(yǔ)音（TTS）模型。模型預(yù)訓(xùn)練超過(guò)10萬(wàn)小時(shí)的播客音頻數(shù)據(jù)，能實(shí)現(xiàn)零樣本語(yǔ)音合成，無(wú)需大量目標(biāo)說(shuō)話人的語(yǔ)音數(shù)據(jù)可生...

閱讀原文

AI工具

7個(gè)月前

ebook2audiobookXTTS：多語(yǔ)言開(kāi)源電子書(shū)轉(zhuǎn)有聲書(shū)AI工具，輕松轉(zhuǎn)換16種語(yǔ)言的文本為生動(dòng)音頻

ebook2audiobookXTTS是開(kāi)源的AI工具，能將電子書(shū)轉(zhuǎn)換為有聲書(shū)。ebook2audiobookXTTS支持多種電子書(shū)格式，如epub、pdf、mobi等，用Coqui XTTS技術(shù)實(shí)現(xiàn)高質(zhì)量的...

閱讀原文

AI工具

1年前 (2024)

VoicePen.ai：智能內(nèi)容生成工具助你輕松創(chuàng)建多媒體博客文章

VoicePen.ai 是AI驅(qū)動(dòng)的內(nèi)容創(chuàng)作工具，能將音頻、視頻、語(yǔ)音備忘錄和網(wǎng)站內(nèi)容快速轉(zhuǎn)換成博客文章。VoicePen.ai 用粘貼鏈接或上傳文件，自動(dòng)生成引人入勝的內(nèi)...

閱讀原文

AI工具

1年前 (2024)

Toucan TTS

Toucan TTS是由德國(guó)斯圖加特大學(xué)自然語(yǔ)言處理研究所（IMS）開(kāi)發(fā)的文本到語(yǔ)音合成工具箱，支持超過(guò)7000種語(yǔ)言，包括多種方言和變體，提供多說(shuō)話人語(yǔ)音合成、語(yǔ)...

閱讀原文

AI工具

1年前 (2024)

ElevenLabs Reader App

ElevenLabs Reader App是由AI語(yǔ)音初創(chuàng)公司ElevenLabs推出的一款文本轉(zhuǎn)語(yǔ)音應(yīng)用，利用AI技術(shù)將各類(lèi)文本內(nèi)容，如文章、PDF文件、ePub等，轉(zhuǎn)化為自然流暢、高音...

閱讀原文

未分類(lèi)

1年前 (2024)

NaturalReader

NaturalReader是一款文本轉(zhuǎn)語(yǔ)音軟件，基于AI技術(shù)將文本文檔轉(zhuǎn)換成自然流暢的語(yǔ)音輸出。軟件支持50多種語(yǔ)言和200多種AI聲音，能處理PDF、Word文檔、電子書(shū)等20...

閱讀原文

AI工具

1年前 (2024)