標(biāo)簽:語(yǔ)音合成

知意配音:多樣化聲音選擇的AI配音工具,200種風(fēng)格任你挑選

知意配音是AI配音軟件,支持多平臺(tái)使用,包括網(wǎng)頁(yè)、桌面軟件、手機(jī)APP和微信小程序。提供200+種不同風(fēng)格的聲音選項(xiàng),滿(mǎn)足各種配音需求。用戶(hù)只需輸入文案,選...
閱讀原文

Free Video-LLM:高效視頻語(yǔ)言模型實(shí)現(xiàn)無(wú)需訓(xùn)練的智能內(nèi)容生成

Free Video-LLM是創(chuàng)新的無(wú)需訓(xùn)練的高效視頻語(yǔ)言模型,基于提示引導(dǎo)的視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)視頻內(nèi)容的高效理解。模型用預(yù)訓(xùn)練的圖像LLMs,無(wú)需額外訓(xùn)練即可適...
閱讀原文

AI音色克隆:微信背后的科技,開(kāi)啟聲音新紀(jì)元!

公眾號(hào),終于開(kāi)始擁抱AI了。
閱讀原文

DeepL Voice:DeepL推出全新實(shí)時(shí)語(yǔ)音翻譯功能

DeepL Voice是DeepL推出的即時(shí)語(yǔ)音翻譯服務(wù),幫助全球團(tuán)隊(duì)打破語(yǔ)言障礙,實(shí)現(xiàn)無(wú)縫溝通。DeepL Voice包括兩個(gè)產(chǎn)品:DeepL Voice for Meetings和DeepL Voice fo...
閱讀原文

OpenVoice

OpenVoice是由MyShell推出的一個(gè)免費(fèi)開(kāi)源的AI即時(shí)語(yǔ)音克隆項(xiàng)目,相較于其他的語(yǔ)音克隆技術(shù),OpenVoice的優(yōu)勢(shì)在于僅需一段簡(jiǎn)短的音頻,便能以驚人的準(zhǔn)確度復(fù)刻...
閱讀原文

GPT-SoVITS

GPT-SoVITS是一個(gè)開(kāi)源的聲音克隆項(xiàng)目,該語(yǔ)音合成工具結(jié)合了GPT模型和SoVITS變聲器技術(shù),僅需通過(guò)少量的樣本數(shù)據(jù)實(shí)現(xiàn)高質(zhì)量的語(yǔ)音克隆和文本到語(yǔ)音轉(zhuǎn)換。該工...
閱讀原文

MeloTTS

MeloTTS 是一個(gè)由 MyShell AI 開(kāi)發(fā)的開(kāi)源的高質(zhì)量多語(yǔ)言文本轉(zhuǎn)語(yǔ)音(TTS)庫(kù),能夠?qū)⑽谋巨D(zhuǎn)換成自然流暢的語(yǔ)音輸出,支持多種語(yǔ)言。MeloTTS 的語(yǔ)音合成速度非...
閱讀原文

VoiceCraft

VoiceCraft是一個(gè)由德克薩斯大學(xué)奧斯汀分校研究團(tuán)隊(duì)開(kāi)源的神經(jīng)編解碼器語(yǔ)言模型,專(zhuān)注于零樣本語(yǔ)音編輯和文本到語(yǔ)音(TTS)任務(wù)。該模型采用Transformer架構(gòu)...
閱讀原文

Voice Engine

Voice Engine是OpenAI最新推出的一項(xiàng)AI語(yǔ)音合成和聲音克隆技術(shù),能夠利用簡(jiǎn)短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽(tīng)起來(lái)的語(yǔ)音。該項(xiàng)技術(shù)自2022年...
閱讀原文

Parler-TTS

Parler-TTS是由Hugging Face推出的一款開(kāi)源的文本到語(yǔ)音(TTS)模型,能夠通過(guò)輸入提示描述模仿特定說(shuō)話(huà)者的風(fēng)格(性別、音調(diào)、說(shuō)話(huà)風(fēng)格等),生成高質(zhì)量、聽(tīng)...
閱讀原文

ChatTTS

ChatTTS是一款專(zhuān)為對(duì)話(huà)場(chǎng)景設(shè)計(jì)的支持中英文的文本轉(zhuǎn)語(yǔ)音(TTS)模型,基于約10萬(wàn)小時(shí)的中英文數(shù)據(jù)進(jìn)行訓(xùn)練,能夠生成高質(zhì)量、自然流暢的對(duì)話(huà)語(yǔ)音。
閱讀原文

Seed-TTS

Seed-TTS是由字節(jié)跳動(dòng)開(kāi)發(fā)的一系列高級(jí)文本到語(yǔ)音(Text to Speech,TTS)模型,能夠生成與人類(lèi)語(yǔ)音極為相似的高質(zhì)量語(yǔ)音,具備出色的上下文學(xué)習(xí)能力和自然度。
閱讀原文

Toucan TTS

Toucan TTS是由德國(guó)斯圖加特大學(xué)自然語(yǔ)言處理研究所(IMS)開(kāi)發(fā)的文本到語(yǔ)音合成工具箱,支持超過(guò)7000種語(yǔ)言,包括多種方言和變體,提供多說(shuō)話(huà)人語(yǔ)音合成、語(yǔ)...
閱讀原文

ElevenLabs Reader App

ElevenLabs Reader App是由AI語(yǔ)音初創(chuàng)公司ElevenLabs推出的一款文本轉(zhuǎn)語(yǔ)音應(yīng)用,利用AI技術(shù)將各類(lèi)文本內(nèi)容,如文章、PDF文件、ePub等,轉(zhuǎn)化為自然流暢、高音...
閱讀原文

Fish Speech

Fish Speech是一款由Fish Audio開(kāi)發(fā)的開(kāi)源的文本到語(yǔ)音(TTS)工具,支持中文、英文和日文。通過(guò)約15萬(wàn)小時(shí)的多語(yǔ)種數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)了接近人類(lèi)水平的語(yǔ)音合成...
閱讀原文
1234