HierVST官網(wǎng)
一種分層自適應(yīng)零樣本語音風(fēng)格轉(zhuǎn)換模型
網(wǎng)站服務(wù):AI開源項目,ai,AI編程,AI開源項目,ai。

HierVST簡介
HierVST audio demo page
HierVST 是一種分層自適應(yīng)零樣本語音風(fēng)格轉(zhuǎn)換模型,它具備以下功能特點:零樣本語音風(fēng)格轉(zhuǎn)換:HierVST 可以在沒有目標說話者語音數(shù)據(jù)的情況下,將一個新的說話者的語音風(fēng)格轉(zhuǎn)換為目標風(fēng)格。這意味著即使沒有目標說話者的語音樣本,HierVST 也可以生成具有目標風(fēng)格的語音。分層自適應(yīng)結(jié)構(gòu):HierVST 使用分層自適應(yīng)生成器,逐步生成音高表示和波形音頻,從而實現(xiàn)逐步轉(zhuǎn)換語音的能力。這種結(jié)構(gòu)讓模型能夠適應(yīng)新的語音風(fēng)格,并逐步進行轉(zhuǎn)換。自監(jiān)督表示學(xué)習(xí):HierVST 僅使用語音數(shù)據(jù)集進行訓(xùn)練,而無需使用文本轉(zhuǎn)錄。它采用了層次變分推斷和自監(jiān)督表示學(xué)習(xí)的方法,提高了模型在音頻表示上的性能。性能優(yōu)于其他模型:在零樣本語音風(fēng)格轉(zhuǎn)換場景中,HierVST 的實驗結(jié)果表明其性能優(yōu)于其他 VST 模型,如 AutoVC、VoiceMixer、DiffVC、Speech Resynthesis 和 YourTTS。
HierVST官網(wǎng)入口網(wǎng)址
OpenI小編發(fā)現(xiàn)HierVST網(wǎng)站非常受用戶歡迎,請訪問HierVST網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的HierVST都來源于網(wǎng)絡(luò),不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 1月 11日 上午6:05收錄時,該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進行刪除,OpenI不承擔(dān)任何責(zé)任。



粵公網(wǎng)安備 44011502001135號