rvc是什么?
RVC,全稱Retrieval based Voice Conversion,是一個(gè)開(kāi)源工具,基于VITS的語(yǔ)音合成系統(tǒng),能實(shí)現(xiàn)實(shí)時(shí)聲音變換,適用于直播、視頻錄制等場(chǎng)景。最新版本V2 0528在Huggingface上可下載。RVC需高配置電腦,建議使用13代酷睿處理器、64GB內(nèi)存、4070ti以上顯卡。只支持Nvidia顯卡。首先下載RVC安裝包和模型包,并解壓。運(yùn)行程序,選擇聲音模型并導(dǎo)入Pt件。連接麥克風(fēng)和聲卡或使用虛擬聲卡。配置設(shè)置后點(diǎn)擊開(kāi)始進(jìn)行實(shí)時(shí)變聲。用戶還可以自行訓(xùn)練模型。
rvc官網(wǎng) 項(xiàng)目地址模型下載:
github下載地址:
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI
hugging face下載地址:
https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main
虛擬聲卡軟件voicemeeter推薦: https://voicemeeter.com/

RVC實(shí)時(shí)AI變聲教程
模型訓(xùn)練和使用方法
RVC(Retrieval based Voice Conversion,檢索式聲音轉(zhuǎn)換)是一個(gè)開(kāi)源工具,基于VITS語(yǔ)音合成系統(tǒng),可實(shí)現(xiàn)實(shí)時(shí)聲音變換。該工具適用于直播、視頻錄制等多種場(chǎng)景。最新版本V2 0528可在Huggingface上進(jìn)行下載。然而,由于RVC對(duì)計(jì)算機(jī)配置要求較高,建議使用13代酷睿處理器、64GB內(nèi)存以及4070ti以上的Nvidia顯卡。
使用RVC的第一步是下載安裝包和模型包,并解壓縮。然后,運(yùn)行程序,選擇所需的聲音模型,并導(dǎo)入相應(yīng)的Pt件。為了實(shí)現(xiàn)聲音轉(zhuǎn)換,需要連接麥克風(fēng)和聲卡,或使用虛擬聲卡進(jìn)行設(shè)置。一旦完成配置設(shè)置,只需點(diǎn)擊開(kāi)始按鈕即可進(jìn)行實(shí)時(shí)變聲。
除了使用現(xiàn)有的模型,用戶還可以根據(jù)自己的需求進(jìn)行模型訓(xùn)練。RVC提供了相關(guān)工具的鏈接,用戶可以在視頻下方找到這些鏈接。

RVC在語(yǔ)音轉(zhuǎn)換領(lǐng)域備受關(guān)注,擁有強(qiáng)大的功能。通過(guò)該工具,用戶可以實(shí)時(shí)將一種聲音轉(zhuǎn)換為另一種聲音,為直播、視頻錄制等應(yīng)用場(chǎng)景增加了更多的創(chuàng)意和可能性。無(wú)論是出于娛樂(lè)目的還是為了達(dá)到更加個(gè)性化的聲音效果,RVC都為用戶提供了靈活且高質(zhì)量的聲音轉(zhuǎn)換解決方案。
需要注意的是,由于RVC對(duì)計(jì)算機(jī)配置要求較高,確保使用高性能的硬件設(shè)備和充足的內(nèi)存資源,才能獲得最佳的使用體驗(yàn)和聲音轉(zhuǎn)換效果。
總之,RVC是一個(gè)功能強(qiáng)大的開(kāi)源工具,基于VITS語(yǔ)音合成系統(tǒng),可實(shí)現(xiàn)實(shí)時(shí)聲音變換。通過(guò)下載安裝包和模型包,并按照指南進(jìn)行配置,用戶可以輕松地進(jìn)行聲音轉(zhuǎn)換,并根據(jù)需要訓(xùn)練自己的模型。RVC為直播、視頻錄制等場(chǎng)景帶來(lái)了更多的創(chuàng)造性和個(gè)性化選項(xiàng),為用戶提供了高質(zhì)量的聲音轉(zhuǎn)換解決方案。

特點(diǎn)
本倉(cāng)庫(kù)具有以下特點(diǎn)
- 使用top1檢索替換輸入源特征為訓(xùn)練集特征來(lái)杜絕音色泄漏
- 即便在相對(duì)較差的顯卡上也能快速訓(xùn)練
- 使用少量數(shù)據(jù)進(jìn)行訓(xùn)練也能得到較好結(jié)果(推薦至少收集10分鐘低底噪語(yǔ)音數(shù)據(jù))
- 可以通過(guò)模型融合來(lái)改變音色(借助ckpt處理選項(xiàng)卡中的ckpt-merge)
- 簡(jiǎn)單易用的網(wǎng)頁(yè)界面
- 可調(diào)用UVR5模型來(lái)快速分離人聲和伴奏
環(huán)境配置
推薦使用poetry配置環(huán)境。
以下指令需在Python版本大于3.8的環(huán)境中執(zhí)行:
# 安裝Pytorch及其核心依賴,若已安裝則跳過(guò)
# 參考自: https://pytorch.org/get-started/locally/
pip install torch torchvision torchaudio
#如果是win系統(tǒng)+Nvidia Ampere架構(gòu)(RTX30xx),根據(jù) #21 的經(jīng)驗(yàn),需要指定pytorch對(duì)應(yīng)的cuda版本
#pip install torch torchvision torchaudio –index-url https://download.pytorch.org/whl/cu117
# 安裝 Poetry 依賴管理工具, 若已安裝則跳過(guò)
# 參考自: https://python-poetry.org/docs/#installation
curl -sSL https://install.python-poetry.org | python3 –
# 通過(guò)poetry安裝依賴
poetry install
數(shù)據(jù)評(píng)估
本站OpenI提供的rvc都來(lái)源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對(duì)于該外部鏈接的指向,不由OpenI實(shí)際控制,在2023年 7月 3日 上午8:28收錄時(shí),該網(wǎng)頁(yè)上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁(yè)的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。



粵公網(wǎng)安備 44011502001135號(hào)