字節(jié)打造大模型TTS:不僅能高保真合成,而且支持調(diào)整編輯

AIGC動態(tài)歡迎閱讀
原標(biāo)題:字節(jié)打造大模型TTS:不僅能高保真合成,而且支持調(diào)整編輯
關(guān)鍵字:語音,模型,字節(jié)跳動,說話,團隊
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
機器之心報道
編輯:Panda通過高保真合成語音與真人語音無異。
首先來聽一段《凡人修仙傳》:你猜的沒錯,這段有聲書并非來自某個專業(yè)制作團隊,而是一個 AI 模型 Seed-TTS,而這個模型則是來自字節(jié)跳動的 Seed Team。
TTS 是指文本轉(zhuǎn)語音,這是一種具備諸多妙用的技術(shù),像是讓個人智能助理說話、為視頻或游戲配音、輔助視障人士、制作有聲書等等。對于 TTS 技術(shù)研發(fā)者來說,流暢自然的表達一直以來都是值得追求的重要目標(biāo)。
字節(jié)跳動 Seed Team 發(fā)布的 Seed-TTS 不只是一個模型,而是一整個模型系列。論文標(biāo)題:Seed-TTS: A Family of High-Quality Versatile Speech Generation Models
論文地址:https://arxiv.org/pdf/2406.02430
演示網(wǎng)站:https://bytedancespeech.github.io/seedtts_tech_report/
據(jù)介紹,該系列模型有能力合成自然度和表現(xiàn)力達到人類水平的語音。不僅如此,Seed-TTS 還能以零樣本方式基于一段較短的錄入語
原文鏈接:字節(jié)打造大模型TTS:不僅能高保真合成,而且支持調(diào)整編輯
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

粵公網(wǎng)安備 44011502001135號