OpenAI 推出語音引擎，只需15秒樣本，即能重建任何人的聲音

AIGC動態2年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：OpenAI 推出語音引擎，只需15秒樣本，即能重建任何人的聲音
關鍵字：政策,聲音,技術,語音,語言
文章來源：夕小瑤科技說
內容字數：5389字

內容摘要：

夕小瑤科技說原創作者 | 付奶茶OpenAI 又帶來了一項超酷的進展！周五推出了一項名為 Voice Engine 的語音引擎，僅憑一段15秒的聲音樣本，便能夠精準模仿出那個人的聲音。
Voice Engine 的獨特之處在于，它能通過簡單的文本輸入和短短音頻樣本，創造出非常接近原始說話者的自然聲音。這意味著無論你讓它讀什么語言的文字，都能以那個人獨有的聲音風格朗讀，效果既逼真又充滿感情。
總而言之，OpenAI 通過這項新技術展示了人工智能復制人聲的驚人可能性，接下來讓我們一起看下吧～
Voice Engine 兩年前已開始研發事實上，OpenAI 早在 2022 年末便啟動了 Voice Engine 的開發，并已利用此技術為其文本到語音 API、ChatGPT Voice 以及朗讀功能裝配了預設聲音。
在技術成功開發后，OpenAI 并未立即向市場全面推廣，而是選擇與一小群早期測試者“小心翼翼”地合作，共同探索其應用可能性和潛在風險。
在與 TechCrunch 的采訪中，OpenAI 產品團隊成員 Jeff Harris 透露，該模型是在“已獲授權和公開可用數據的結合”上進行

原文鏈接：OpenAI 推出語音引擎，只需15秒樣本，即能重建任何人的聲音

聯系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內外機構投資人，互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠，兼備敏銳的行業嗅覺和洞察深度。商務合作：zym5189

閱讀原文