AIGC動態歡迎閱讀
原標題:OpenAI首次官宣語音項目,配音演員警報拉響
關鍵字:音頻,語音,聲音,美元,樣本
文章來源:機器之心
內容字數:2730字
內容摘要:
機器之心報道
編輯:陳萍文本輸入和一個 15 秒的音頻樣本就能生成與原始說話者非常相似的自然聲音。今天,OpenAI 在語音領域又帶給我們一點點震撼,通過文本輸入以及一段 15 秒的音頻示例,可以生成既自然又與原聲極為接近的語音。值得注意的是,即使是小模型,只需一個 15 秒的樣本,也能創造出富有情感且逼真的聲音。
OpenAI 將這個語音引擎命名為 Voice Engine,首次開發時間是 2022 年末,今天是 Voice Engine 預覽版的首次亮相。下面為該語音引擎的一些早期示例,例如可以幫助用戶翻譯視頻和播客等內容,輸入一段原始音頻:
Voice Engine 可以翻譯成西班牙語:
還能翻譯成中文:
以及日語:
Voice Engine 為有語言障礙的人合成相似的聲音,使得用戶在每種口語中保持聲音一致:
輸入參考音頻:
生成的音頻(英語):
生成的音頻(葡萄牙語):
又比如,幫助患有突發性或退化性言語病癥的患者說話。
原始聲音:
參考聲音:
生成的音頻:
令人驚訝的是,Voice Engine 并未根據用戶數據進行訓練或微調,而是通過一個擴散過程和 transformer
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...