大規(guī)模多語(yǔ)種語(yǔ)音生成數(shù)據(jù)集
300行代碼實(shí)現(xiàn)基于LLM的語(yǔ)音轉(zhuǎn)錄。
與任何大型語(yǔ)言模型進(jìn)行快速的免提語(yǔ)音交互。
與大型語(yǔ)言模型進(jìn)行自然的語(yǔ)音對(duì)話(huà)
個(gè)性化AI助手,記錄每一刻,與AI對(duì)話(huà)獲取反饋。
極速語(yǔ)音識(shí)別,精準(zhǔn)時(shí)間戳
開(kāi)源的語(yǔ)音識(shí)別和說(shuō)話(huà)人分割模型推理代碼
一款文本轉(zhuǎn)語(yǔ)音工具,幫助您輕松閱讀文本。
Android平臺(tái)上的私有、設(shè)備端語(yǔ)音識(shí)別鍵盤(pán)和文字服務(wù)
統(tǒng)一的開(kāi)放命名實(shí)體和語(yǔ)音識(shí)別模型
開(kāi)源AI語(yǔ)音處理工具包,支持語(yǔ)音增強(qiáng)、分離和目標(biāo)說(shuō)話(huà)人提取。
實(shí)時(shí)瀏覽器端語(yǔ)音識(shí)別應(yīng)用
開(kāi)源、注重隱私的語(yǔ)音助手
自動(dòng)語(yǔ)音識(shí)別工具,提供詞級(jí)時(shí)間戳和說(shuō)話(huà)人識(shí)別
AI語(yǔ)音代理測(cè)試與可觀測(cè)性平臺(tái)
基于PyTorch的生成式音頻模型庫(kù)
一個(gè)開(kāi)源的GUI音頻書(shū)和配音生成器。
ComfyUI節(jié)點(diǎn),用于MMAudio模型的音頻處理
使用API調(diào)用suno.ai的音樂(lè)生成AI,并輕松集成到GPT等代理中。
開(kāi)源項(xiàng)目,實(shí)現(xiàn)AI音樂(lè)服務(wù)的API接口
音頻采樣器,創(chuàng)造音樂(lè)節(jié)奏
一鍵生成海量模板,支持SaaS多開(kāi)的全開(kāi)源系統(tǒng)
開(kāi)源自主軟件開(kāi)發(fā)系統(tǒng)
開(kāi)源大型語(yǔ)言模型工具集合
利用AI生成的Next.js開(kāi)源應(yīng)用模板。
全棧開(kāi)源機(jī)器人
開(kāi)源AI網(wǎng)關(guān)和開(kāi)發(fā)者門(mén)戶(hù),輕松管理、集成和部署AI服務(wù)。
一個(gè)開(kāi)源的交互式開(kāi)發(fā)環(huán)境,用于構(gòu)建和優(yōu)化基于LLM的數(shù)據(jù)處理管道。
AI組件驅(qū)動(dòng)技術(shù),一行文本即可創(chuàng)建、設(shè)計(jì)和開(kāi)發(fā)網(wǎng)頁(yè)組件。
低代碼工具,快速構(gòu)建和協(xié)調(diào)多智能體團(tuán)隊(duì)
一個(gè)強(qiáng)大的OCR包,使用最先進(jìn)的視覺(jué)語(yǔ)言模型提取圖像中的文本。
開(kāi)源AI代碼編輯器,提供強(qiáng)大的AI功能和完全的數(shù)據(jù)控制。
OpenI AI助手在線(xiàn)工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙