AudioGPT
AudioGPT官網(wǎng)
借助大語言模型(LLM)處理音頻的工具
網(wǎng)站服務(wù):AI開源項(xiàng)目,ai,AI編程,AI開源項(xiàng)目,ai。
AudioGPT簡介
AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head – GitHub – AIGC-Audio/AudioGPT: AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head
這是一個(gè)借助大語言模型(LLM)處理音頻的工具,可以:
– 生成音樂
– 背景音效
– 音頻生成字幕
– 文字生成音頻
– 文字生成音頻并模擬聲音
– 根據(jù)圖片生成音頻
– 對音頻進(jìn)行inpaint(局部屏蔽)
– 根據(jù)音頻和人臉照片合成視頻
– 檢測音頻中的,以及開始和結(jié)束時(shí)間
– 單聲道變雙聲道
– 通過文本描述檢測特定聲音發(fā)生的時(shí)間
– 抽取某種聲音
– 去除背景噪音
多人混合聲分離出單人聲音
語音翻譯http://github.com/AIGC-Audio/AudioGPT
演示:https://huggingface.co/spaces/AIGC-Audio/AudioGPT
論文:https://arxiv.org/abs/2304.12995
AudioGPT官網(wǎng)入口網(wǎng)址
https://github.com/AIGC-Audio/AudioGPT
OpenI小編發(fā)現(xiàn)AudioGPT網(wǎng)站非常受用戶歡迎,請?jiān)L問AudioGPT網(wǎng)址入口試用。
數(shù)據(jù)評估
本站OpenI提供的AudioGPT都來源于網(wǎng)絡(luò),不保證外部鏈接的準(zhǔn)確性和完整性,同時(shí),對于該外部鏈接的指向,不由OpenI實(shí)際控制,在2024年 1月 11日 上午6:15收錄時(shí),該網(wǎng)頁上的內(nèi)容,都屬于合規(guī)合法,后期網(wǎng)頁的內(nèi)容如出現(xiàn)違規(guī),可以直接聯(lián)系網(wǎng)站管理員進(jìn)行刪除,OpenI不承擔(dān)任何責(zé)任。