AIGC動態歡迎閱讀
原標題:國產最強語音大模型誕生,MaskGCT宣布開源,聲音效果媲美人類
關鍵字:語義,語音,模型,標記,聲學
文章來源:機器之心
內容字數:0字
內容摘要:
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或者聯系報道。投稿郵箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com近期,港中大(深圳)聯手趣丸科技聯合推出了新一代大規模聲音克隆 TTS 模型 ——MaskGCT。該模型在包含 10 萬小時多語言數據的 Emilia 數據集上進行訓練,展現出超自然的語音克隆、風格遷移以及跨語言生成能力,同時保持了較強的穩定性。MaskGCT 已在香港中文大學(深圳)與上海人工智能實驗室聯合開發的開源系統 Amphion 發布。論文鏈接:https://arxiv.org/abs/2409.00750
樣例展示:https://maskgct.github.io
模型下載:https://huggingface.co/amphion/maskgct
Demo 展示:https://huggingface.co/spaces/amphion/m
原文鏈接:國產最強語音大模型誕生,MaskGCT宣布開源,聲音效果媲美人類
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...