Stability AI開源47秒音頻生成模型,蟲鳴鳥叫、搖滾、鼓點(diǎn)都能生成
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:Stability AI開源47秒音頻生成模型,蟲鳴鳥叫、搖滾、鼓點(diǎn)都能生成
關(guān)鍵字:模型,數(shù)據(jù),音樂,音頻,樣本
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:蛋醬、小舟音頻生成領(lǐng)域又有好消息:剛剛,Stability AI 宣布推出開放模型 Stable Audio Open,該模型能夠生成高質(zhì)量的音頻數(shù)據(jù)。項(xiàng)目地址:https://huggingface.co/stabilityai/stable-audio-open-1.0
與 Stability AI 的商業(yè) Stable Audio 產(chǎn)品(可生成長達(dá)三分鐘的更長、連貫的音樂曲目)不同,Stable Audio Open 可以通過簡單的文本提示生成長達(dá) 47 秒的高質(zhì)量音頻數(shù)據(jù)。
經(jīng)過專業(yè)訓(xùn)練后,這個(gè)模型已經(jīng)非常適合創(chuàng)建鼓點(diǎn)、樂器 riffs、環(huán)境音、擬聲錄音和其他用于音樂制作和聲音設(shè)計(jì)的音頻樣本。雖然它可以生成簡短的音樂片段,但它并未針對(duì)完整的歌曲、旋律或人聲進(jìn)行優(yōu)化。
Stable Audio Open 的主要優(yōu)勢在于,用戶可以根據(jù)自己的自定義音頻數(shù)據(jù)對(duì)模型進(jìn)行微調(diào)。
比如,下方是鼓手根據(jù)自己的鼓聲錄音樣本進(jìn)行微調(diào)生成的新節(jié)拍:生成森林中鳥兒唱歌的音頻:再生成一段「動(dòng)次打次」的搖滾樂:訓(xùn)練細(xì)節(jié)與數(shù)據(jù)集
Stable Audio Open 是基于 Transfo
原文鏈接:Stability AI開源47秒音頻生成模型,蟲鳴鳥叫、搖滾、鼓點(diǎn)都能生成
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)