爆火ChatTTS突破開(kāi)源語(yǔ)音天花板,3天斬獲9k的Star量

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:爆火ChatTTS突破開(kāi)源語(yǔ)音天花板,3天斬獲9k的Star量
關(guān)鍵字:文本,音色,韻律,語(yǔ)音,語(yǔ)氣詞
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:陳萍、佳琪未來(lái)人與人的交流,難道是這個(gè)樣?近日,一個(gè)名為 ChatTTS 文本轉(zhuǎn)語(yǔ)音項(xiàng)目爆火出圈,引來(lái)大家極大的關(guān)注。短短三天時(shí)間,在 GitHub 上已經(jīng)斬獲了 9.2 k 的 Star 量。項(xiàng)目地址:https://github.com/2noise/ChatTTS/tree/main
作者本人也在 x 上表示,ChatTTS 突破了開(kāi)源天花板。不過(guò),目前開(kāi)源的只是底模,沒(méi)有經(jīng)過(guò) SFT 監(jiān)督微調(diào)。該項(xiàng)目將文本轉(zhuǎn)換成語(yǔ)音,效果是這樣的:ChatTTS 不僅能說(shuō)中文,英文也能 hold 住,還支持一些細(xì)粒度控制,它允許你加入笑聲、說(shuō)話間的停頓,還有語(yǔ)氣詞,可玩性很強(qiáng)。它可以復(fù)刻已經(jīng)逝去的人的絕版聲音,想要再聽(tīng)到喬布斯開(kāi)發(fā)布會(huì),隨時(shí)都可以。聽(tīng)它模仿霉霉的音色,不論是語(yǔ)調(diào)還是語(yǔ)氣的變化,都挺接近本人,幾乎聽(tīng)不出來(lái) AI 味兒。中英文混說(shuō)也能拿捏,這口半英半中的腔調(diào)勇闖留子圈,ChatTTS 的語(yǔ)言能力已達(dá)到 next level。以上音頻來(lái)自 B 站:https://www.bilibili.com/video/BV1zn4y1o7iV/?share_source=c
原文鏈接:爆火ChatTTS突破開(kāi)源語(yǔ)音天花板,3天斬獲9k的Star量
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:almosthuman2014
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)