OpenAI 推出語(yǔ)音引擎,只需15秒樣本,即能重建任何人的聲音
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:OpenAI 推出語(yǔ)音引擎,只需15秒樣本,即能重建任何人的聲音
關(guān)鍵字:政策,聲音,技術(shù),語(yǔ)音,語(yǔ)言
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):5389字
內(nèi)容摘要:
夕小瑤科技說(shuō) 原創(chuàng)作者 | 付奶茶OpenAI 又帶來(lái)了一項(xiàng)超酷的進(jìn)展!周五推出了一項(xiàng)名為 Voice Engine 的語(yǔ)音引擎,僅憑一段15秒的聲音樣本,便能夠精準(zhǔn)模仿出那個(gè)人的聲音。
Voice Engine 的獨(dú)特之處在于,它能通過(guò)簡(jiǎn)單的文本輸入和短短音頻樣本,創(chuàng)造出非常接近原始說(shuō)話者的自然聲音。這意味著無(wú)論你讓它讀什么語(yǔ)言的文字,都能以那個(gè)人獨(dú)有的聲音風(fēng)格朗讀,效果既逼真又充滿感情。
總而言之,OpenAI 通過(guò)這項(xiàng)新技術(shù)展示了人工智能復(fù)制人聲的驚人可能性,接下來(lái)讓我們一起看下吧~
Voice Engine 兩年前已開(kāi)始研發(fā)事實(shí)上,OpenAI 早在 2022 年末便啟動(dòng)了 Voice Engine 的開(kāi)發(fā),并已利用此技術(shù)為其文本到語(yǔ)音 API、ChatGPT Voice 以及朗讀功能裝配了預(yù)設(shè)聲音。
在技術(shù)成功開(kāi)發(fā)后,OpenAI 并未立即向市場(chǎng)全面推廣,而是選擇與一小群早期測(cè)試者“小心翼翼”地合作,共同探索其應(yīng)用可能性和潛在風(fēng)險(xiǎn)。
在與 TechCrunch 的采訪中,OpenAI 產(chǎn)品團(tuán)隊(duì)成員 Jeff Harris 透露,該模型是在“已獲授權(quán)和公開(kāi)可用數(shù)據(jù)的結(jié)合”上進(jìn)行
原文鏈接:OpenAI 推出語(yǔ)音引擎,只需15秒樣本,即能重建任何人的聲音
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:專業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬(wàn)AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來(lái)自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺(jué)和洞察深度。商務(wù)合作:zym5189