AIGC動態歡迎閱讀
原標題:OpenAI 推出語音引擎,只需15秒樣本,即能重建任何人的聲音
關鍵字:政策,聲音,技術,語音,語言
文章來源:夕小瑤科技說
內容字數:5389字
內容摘要:
夕小瑤科技說 原創作者 | 付奶茶OpenAI 又帶來了一項超酷的進展!周五推出了一項名為 Voice Engine 的語音引擎,僅憑一段15秒的聲音樣本,便能夠精準模仿出那個人的聲音。
Voice Engine 的獨特之處在于,它能通過簡單的文本輸入和短短音頻樣本,創造出非常接近原始說話者的自然聲音。這意味著無論你讓它讀什么語言的文字,都能以那個人獨有的聲音風格朗讀,效果既逼真又充滿感情。
總而言之,OpenAI 通過這項新技術展示了人工智能復制人聲的驚人可能性,接下來讓我們一起看下吧~
Voice Engine 兩年前已開始研發事實上,OpenAI 早在 2022 年末便啟動了 Voice Engine 的開發,并已利用此技術為其文本到語音 API、ChatGPT Voice 以及朗讀功能裝配了預設聲音。
在技術成功開發后,OpenAI 并未立即向市場全面推廣,而是選擇與一小群早期測試者“小心翼翼”地合作,共同探索其應用可能性和潛在風險。
在與 TechCrunch 的采訪中,OpenAI 產品團隊成員 Jeff Harris 透露,該模型是在“已獲授權和公開可用數據的結合”上進行
原文鏈接:OpenAI 推出語音引擎,只需15秒樣本,即能重建任何人的聲音
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189