耳朵沒錯,是聲音太真了,字節(jié)豆包語音合成成果Seed-TTS技術(shù)揭秘
AIGC動態(tài)歡迎閱讀
原標(biāo)題:耳朵沒錯,是聲音太真了,字節(jié)豆包語音合成成果Seed-TTS技術(shù)揭秘
關(guān)鍵字:模型,語音,字節(jié)跳動,報告,技術(shù)
文章來源:機器之心
內(nèi)容字數(shù):0字
內(nèi)容摘要:
機器之心發(fā)布
機器之心編輯部Seed-TTS 是字節(jié)跳動豆包大模型團隊近期發(fā)布的語音生成大模型成果。它生成的語音幾乎與真人完全一樣,音瑕疵也能生成出來,尤其在學(xué)習(xí)模仿人類說話方面,相似性和自然度均有很好表現(xiàn)。舉例來說,將一段語音提供給 Seed-TTS,它就能按文本生成全新語音,且?guī)显夭牡穆曇籼卣鳌?br />原素材(Prompt):Seed-TTS 生成的中文語音:突然,身邊一陣笑聲。我看著他們,意氣風(fēng)發(fā)地挺直了胸膛,甩了甩那稍顯肉感的雙臂,輕笑道:“我身上的肉,是為了掩飾我爆棚的魅力,否則,豈不嚇壞了你們呢?”英文語音也可生成,且依然能“復(fù)刻”中文發(fā)音者的特點。
Seed-TTS 生成的英文語音:Suddenly, there was a burst of laughter beside me. I looked at them, stood up straight with high spirit, shook the slightly fleshy arms, and smiled lightly, saying, “The flesh on my body is to hide
原文鏈接:耳朵沒錯,是聲音太真了,字節(jié)豆包語音合成成果Seed-TTS技術(shù)揭秘
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺
相關(guān)文章
