今日arXiv最熱NLP大模型論文：浙大發布歌曲合成工具Prompt-Singer，歌手性別風格均可控！

AIGC動態2年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：今日arXiv最熱NLP大模型論文：浙大發布歌曲合成工具Prompt-Singer，歌手性別風格均可控！
關鍵字：模型,數據,提示,自然語言,歌聲
文章來源：夕小瑤科技說
內容字數：9225字

內容摘要：

夕小瑤科技說原創作者 | Tscom本項目測試參考歌聲，歌詞“風吹來的砂冥冥在哭泣，難道早就預言了分離”：
提示詞“I want to listen to a song with a man voice.”生成的歌聲：
提示詞“I’m in the mood for a song performed by a madam artist.”生成的歌聲：
引言：自然語言指令在歌聲合成中的新突破在數字音頻技術的發展歷程中，歌聲合成（Singing Voice Synthesis, SVS）一直是一個充滿挑戰的領域。隨著深度學習的興起，SVS系統已經能夠生成高保真度的歌聲，為音樂創作和娛樂產業的發展提供了新的動力。然而，盡管現有的SVS方法在音頻質量和自然度上取得了顯著進步，它們通常缺乏對合成歌聲風格屬性的明確控制能力。這些風格屬性包括說話者音色、聲音范圍和能量等。為了解決這一問題，研究者們開始探索使用自然語言指令作為風格提示，以期實現對合成歌聲的精確控制。
自然語言指令的使用不僅可以實現對特定屬性的精確控制，還可以簡化用戶交互，為非計算機專業用戶如音樂家和視頻創作者帶來便利。然而，將自然語

原文鏈接：今日arXiv最熱NLP大模型論文：浙大發布歌曲合成工具Prompt-Singer，歌手性別風格均可控！

聯系作者

文章來源：夕小瑤科技說
作者微信：xixiaoyaoQAQ
作者簡介：專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員，覆蓋500多家海內外機構投資人，互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠，兼備敏銳的行業嗅覺和洞察深度。商務合作：zym5189

閱讀原文