腦電合成自然語音！LeCun轉發Nature子刊新成果，代碼開源

AIGC動態1年前 (2024)發布量子位

AIGC動態歡迎閱讀

原標題：腦電合成自然語音！LeCun轉發Nature子刊新成果，代碼開源
關鍵字：語音,因果,模型,神經,半球
文章來源：量子位
內容字數：8397字

內容摘要：

Xupeng 投稿量子位 | 公眾號 QbitAI腦機接口最新進展登上Nature子刊，深度學習三巨頭之一的LeCun都來轉發。
這次是用神經信號進行語音合成，幫助因神經系統缺陷導致失語的人群重新獲得交流的能力。
具體來說，來自紐約大學的研究團隊開發了一個新型的可微分語音合成器，可以利用一個輕型的卷積神經網絡將語音編碼為一系列可解釋的語音參數（如音高，響度，共振峰頻率等），并通過可微分語音合成器重新合成語音。
通過將神經信號映射到這些語音參數，研究者構建了一個高度可解釋且可應用于小數據量情形的神經語音解碼系統，可生成聽起來自然的語音。
研究人員共收集了48位受試者的數據并嘗試進行語音解碼，對未來的高準確度的腦機接口應用提供了驗證。
結果表明，該框架能夠處理高低不同空間采樣密度，并且可以處理左、右半球的腦電信號，顯示出了強大的語音解碼潛力。
神經信號的語音解碼，難！此前，馬斯克的Neuralink公司已經在一位受試者腦內成功植入電極，可以完成簡單的光標操控以實現打字等功能。
然而，神經-語音解碼通常被認為復雜度更高。
開發神經-語音解碼器和其他的高精度腦機接口模型的嘗試大多數依賴于一種特

原文鏈接：腦電合成自然語音！LeCun轉發Nature子刊新成果，代碼開源