標(biāo)簽:語(yǔ)音合成
知意配音:多樣化聲音選擇的AI配音工具,200種風(fēng)格任你挑選
知意配音是AI配音軟件,支持多平臺(tái)使用,包括網(wǎng)頁(yè)、桌面軟件、手機(jī)APP和微信小程序。提供200+種不同風(fēng)格的聲音選項(xiàng),滿(mǎn)足各種配音需求。用戶(hù)只需輸入文案,選...
Free Video-LLM:高效視頻語(yǔ)言模型實(shí)現(xiàn)無(wú)需訓(xùn)練的智能內(nèi)容生成
Free Video-LLM是創(chuàng)新的無(wú)需訓(xùn)練的高效視頻語(yǔ)言模型,基于提示引導(dǎo)的視覺(jué)感知技術(shù),實(shí)現(xiàn)對(duì)視頻內(nèi)容的高效理解。模型用預(yù)訓(xùn)練的圖像LLMs,無(wú)需額外訓(xùn)練即可適...
DeepL Voice:DeepL推出全新實(shí)時(shí)語(yǔ)音翻譯功能
DeepL Voice是DeepL推出的即時(shí)語(yǔ)音翻譯服務(wù),幫助全球團(tuán)隊(duì)打破語(yǔ)言障礙,實(shí)現(xiàn)無(wú)縫溝通。DeepL Voice包括兩個(gè)產(chǎn)品:DeepL Voice for Meetings和DeepL Voice fo...
GPT-SoVITS
GPT-SoVITS是一個(gè)開(kāi)源的聲音克隆項(xiàng)目,該語(yǔ)音合成工具結(jié)合了GPT模型和SoVITS變聲器技術(shù),僅需通過(guò)少量的樣本數(shù)據(jù)實(shí)現(xiàn)高質(zhì)量的語(yǔ)音克隆和文本到語(yǔ)音轉(zhuǎn)換。該工...
VoiceCraft
VoiceCraft是一個(gè)由德克薩斯大學(xué)奧斯汀分校研究團(tuán)隊(duì)開(kāi)源的神經(jīng)編解碼器語(yǔ)言模型,專(zhuān)注于零樣本語(yǔ)音編輯和文本到語(yǔ)音(TTS)任務(wù)。該模型采用Transformer架構(gòu)...
Voice Engine
Voice Engine是OpenAI最新推出的一項(xiàng)AI語(yǔ)音合成和聲音克隆技術(shù),能夠利用簡(jiǎn)短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽(tīng)起來(lái)的語(yǔ)音。該項(xiàng)技術(shù)自2022年...
Parler-TTS
Parler-TTS是由Hugging Face推出的一款開(kāi)源的文本到語(yǔ)音(TTS)模型,能夠通過(guò)輸入提示描述模仿特定說(shuō)話(huà)者的風(fēng)格(性別、音調(diào)、說(shuō)話(huà)風(fēng)格等),生成高質(zhì)量、聽(tīng)...
Toucan TTS
Toucan TTS是由德國(guó)斯圖加特大學(xué)自然語(yǔ)言處理研究所(IMS)開(kāi)發(fā)的文本到語(yǔ)音合成工具箱,支持超過(guò)7000種語(yǔ)言,包括多種方言和變體,提供多說(shuō)話(huà)人語(yǔ)音合成、語(yǔ)...
ElevenLabs Reader App
ElevenLabs Reader App是由AI語(yǔ)音初創(chuàng)公司ElevenLabs推出的一款文本轉(zhuǎn)語(yǔ)音應(yīng)用,利用AI技術(shù)將各類(lèi)文本內(nèi)容,如文章、PDF文件、ePub等,轉(zhuǎn)化為自然流暢、高音...
Fish Speech
Fish Speech是一款由Fish Audio開(kāi)發(fā)的開(kāi)源的文本到語(yǔ)音(TTS)工具,支持中文、英文和日文。通過(guò)約15萬(wàn)小時(shí)的多語(yǔ)種數(shù)據(jù)訓(xùn)練,實(shí)現(xiàn)了接近人類(lèi)水平的語(yǔ)音合成...