AIGC動態歡迎閱讀
原標題:今日arXiv最熱NLP大模型論文:浙大發布歌曲合成工具Prompt-Singer,歌手性別風格均可控!
關鍵字:模型,數據,提示,自然語言,歌聲
文章來源:夕小瑤科技說
內容字數:9225字
內容摘要:
夕小瑤科技說 原創作者 | Tscom本項目測試參考歌聲,歌詞“風吹來的砂冥冥在哭泣,難道早就預言了分離”:
提示詞“I want to listen to a song with a man voice.”生成的歌聲:
提示詞“I’m in the mood for a song performed by a madam artist.”生成的歌聲:
引言:自然語言指令在歌聲合成中的新突破在數字音頻技術的發展歷程中,歌聲合成(Singing Voice Synthesis, SVS)一直是一個充滿挑戰的領域。隨著深度學習的興起,SVS系統已經能夠生成高保真度的歌聲,為音樂創作和娛樂產業的發展提供了新的動力。然而,盡管現有的SVS方法在音頻質量和自然度上取得了顯著進步,它們通常缺乏對合成歌聲風格屬性的明確控制能力。這些風格屬性包括說話者音色、聲音范圍和能量等。為了解決這一問題,研究者們開始探索使用自然語言指令作為風格提示,以期實現對合成歌聲的精確控制。
自然語言指令的使用不僅可以實現對特定屬性的精確控制,還可以簡化用戶交互,為非計算機專業用戶如音樂家和視頻創作者帶來便利。然而,將自然語
原文鏈接:今日arXiv最熱NLP大模型論文:浙大發布歌曲合成工具Prompt-Singer,歌手性別風格均可控!
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189