AIGC動態歡迎閱讀
原標題:大規模、動態「語音增強/分離」新基準!清華發布移動音源仿真平臺SonicSim,含950+小時訓練數據
關鍵字:聲源,數據,環境,語音,聲學
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:LRST
【新智元導讀】清華大學推出的SonicSim平臺和SonicSet數據集針對動態聲源的語音處理研究提供了強有力的工具和數據支持,有效降低了數據采集成本,實驗證明這些工具能有效提升模型在真實環境中的性能。隨著語音技術的快速發展,現有的語音分離和增強方法在靜態環境下已經取得了顯著的進展。然而,在動態環境中,這些方法的性能仍然存在很大的不確定性。
目前,用于研究動態聲源的數據集極為稀少,主要原因是錄制成本高昂,難以大規模應用,極大地阻礙了動態環境下語音分離與增強技術的發展和應用。
為了應對這一挑戰,清華大學研究團隊開發了SonicSim仿真平臺和SonicSet數據集:
SonicSim是一個高度可定制的數據生成工具,能夠模擬各種復雜的動態聲源場景;
SonicSet則是基于SonicSim生成的大規模動態聲源數據集,為語音分離和增強研究提供了豐富的訓練和測試數據,這一創新性的解決方案不僅大幅降低了數據采集成本,還為動態語音處理技術的發展提供了強有力的支持。論文地址:https://arxiv.org/abs/2410.01481
項目主頁:https://csl
原文鏈接:大規模、動態「語音增強/分離」新基準!清華發布移動音源仿真平臺SonicSim,含950+小時訓練數據
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...