為LTX視頻模型提供額外控制的ComfyUI節(jié)點(diǎn)集合
視頻處理界面,提供視頻編碼和解碼功能
開放高效的視頻水印技術(shù)
AI數(shù)字人口型同步技術(shù),無限多開貼牌OEM解決方案
一站式AI數(shù)字人系統(tǒng),支持視頻合成、聲音合成、聲音克隆。
領(lǐng)先的文本到語音轉(zhuǎn)換模型
大規(guī)模多語種語音生成數(shù)據(jù)集
300行代碼實(shí)現(xiàn)基于LLM的語音轉(zhuǎn)錄。
與任何大型語言模型進(jìn)行快速的免提語音交互。
與大型語言模型進(jìn)行自然的語音對(duì)話
個(gè)性化AI助手,記錄每一刻,與AI對(duì)話獲取反饋。
極速語音識(shí)別,精準(zhǔn)時(shí)間戳
開源的語音識(shí)別和說話人分割模型推理代碼
一款文本轉(zhuǎn)語音工具,幫助您輕松閱讀文本。
Android平臺(tái)上的私有、設(shè)備端語音識(shí)別鍵盤和文字服務(wù)
統(tǒng)一的開放命名實(shí)體和語音識(shí)別模型
開源AI語音處理工具包,支持語音增強(qiáng)、分離和目標(biāo)說話人提取。
實(shí)時(shí)瀏覽器端語音識(shí)別應(yīng)用
開源、注重隱私的語音助手
自動(dòng)語音識(shí)別工具,提供詞級(jí)時(shí)間戳和說話人識(shí)別
AI語音代理測(cè)試與可觀測(cè)性平臺(tái)
基于PyTorch的生成式音頻模型庫
一個(gè)開源的GUI音頻書和配音生成器。
ComfyUI節(jié)點(diǎn),用于MMAudio模型的音頻處理
使用API調(diào)用suno.ai的音樂生成AI,并輕松集成到GPT等代理中。
開源項(xiàng)目,實(shí)現(xiàn)AI音樂服務(wù)的API接口
音頻采樣器,創(chuàng)造音樂節(jié)奏
一鍵生成海量模板,支持SaaS多開的全開源系統(tǒng)
開源自主軟件開發(fā)系統(tǒng)
開源大型語言模型工具集合
利用AI生成的Next.js開源應(yīng)用模板。
全棧開源機(jī)器人
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙