AIGC動態歡迎閱讀
原標題:耳朵沒錯,是聲音太真了,字節豆包語音合成成果Seed-TTS技術揭秘
關鍵字:模型,語音,字節跳動,報告,技術
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心發布
機器之心編輯部Seed-TTS 是字節跳動豆包大模型團隊近期發布的語音生成大模型成果。它生成的語音幾乎與真人完全一樣,音瑕疵也能生成出來,尤其在學習模仿人類說話方面,相似性和自然度均有很好表現。舉例來說,將一段語音提供給 Seed-TTS,它就能按文本生成全新語音,且帶上原素材的聲音特征。
原素材(Prompt):Seed-TTS 生成的中文語音:突然,身邊一陣笑聲。我看著他們,意氣風發地挺直了胸膛,甩了甩那稍顯肉感的雙臂,輕笑道:“我身上的肉,是為了掩飾我爆棚的魅力,否則,豈不嚇壞了你們呢?”英文語音也可生成,且依然能“復刻”中文發音者的特點。
Seed-TTS 生成的英文語音:Suddenly, there was a burst of laughter beside me. I looked at them, stood up straight with high spirit, shook the slightly fleshy arms, and smiled lightly, saying, “The flesh on my body is to hide
原文鏈接:耳朵沒錯,是聲音太真了,字節豆包語音合成成果Seed-TTS技術揭秘
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...