標簽:音頻分析

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Soundwave

Soundwave是香港中文大學(深圳)開源的語音理解大模型,專注于語音與文本的智能對齊和理解。通過創新的對齊適配器和壓縮適配器技術,有效解決了語音和文本在...
閱讀原文

gpt-4o-mini-transcribe

gpt-4o-mini-transcribe 是 OpenAI 推出的語音轉文本模型,gpt-4o-transcribe的精簡版。gpt-4o-mini-transcribe 基于 GPT-4o-mini 架構,用知識蒸餾技術從大...
閱讀原文

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音頻大語言模型,支持無縫集成音頻理解和生成功能,實現支持高質量、可控的實時中英雙語對話。Baichuan-Audio基于多碼...
閱讀原文

Step-Audio

Step-Audio是階躍星辰團隊推出的首個產品級的開源語音交互模型,能根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地進行高...
閱讀原文

ClearerVoice-Studio:智能語音處理框架助力多場景應用的高效解決方案

ClearerVoice-Studio 是阿里巴巴達摩院通義實驗室開源的語音處理框架,集成語音增強、分離和音視頻說話人提取等功能。框架基于復數域深度學習算法,有效消除...
閱讀原文

Audio Decomposition:輕松轉換音樂為五線譜的開源工具

Audio Decomposition是音頻處理技術,基于傅里葉變換和信封匹配將音樂中的各個音符和樂器分離,實現音樂到樂譜的轉換。Audio Decomposition開源項目是Matthew...
閱讀原文

Musicfy AI

Musicfy AI是一個AI音樂創作平臺,基于人工智能技術簡化了音樂制作流程。用戶可以上傳自己的聲音樣本,Musicfy AI將學習并模擬這些聲音,創建個性化的AI聲音...
閱讀原文

Draw an Audio

Draw an Audio 是中國科學院自動化研究所和美團點評的研究人員推出的視頻生成音頻系統。根據視頻內容自動生成匹配的聲音效果,類似于電影制作中的 Foley 藝術...
閱讀原文

EzAudio

EzAudio是由約翰霍普金斯大學和騰訊AI實驗室共同推出的一款文本到音頻(Text-to-Audio, T2A)生成模型。基于一種高效的擴散變換器技術,用在從文本提示生成高...
閱讀原文

Podcastfy

Podcastfy 是一個開源的 Python 軟件包,能將網絡內容、PDF 文檔及文本轉換成多語言的音頻對話形式。這款工具采用了先進的生成式人工智能(GenAI)技術,類似...
閱讀原文

音鹿

音鹿是AI音頻編輯軟件,提供文字轉語音、海量音色選擇、AI翻唱、音頻編輯工具等功能。用戶能生成不同音色配音文件,上傳音色為歌曲配音,適于多個社交平臺。...
閱讀原文

Remusic

Remusic是創新的AI音樂創作平臺,基于AI技術簡化音樂創作過程。用戶提供個人偏好,Remusic能生成高質量、風格多樣的音樂作品,包括旋律和歌詞。Remusic為現有...
閱讀原文