智能會議助手,實現會議內容實時轉寫與總結。
一個簡單易用的語音克隆和語音模型訓練工具。
將電子書轉換為有聲書的工具。
基于Kokoro和ONNX運行時的文本到語音(TTS)項目。
Whisper Turbo 是一款免費在線快速準確的語音識別工具。
Whisper Input 是一個通過按鍵控制語音錄制并快速轉譯的工具。
首個面向語境智能的人類級實時交互系統,支持多情感、多風格語音交互。
LLaSA: 擴展基于 LLaMA 的語音合成的訓練時間和測試時間計算量
開源工業級自動語音識別模型,支持普通話、方言和英語,性能卓越。
一款為 Apple Watch 設計的智能語音助手應用,無需手機即可完成多種操作。
一個提供語音克隆和AI語音內容創作的平臺。
為酒店提供多語言AI語音代理,提升客戶體驗并降低運營成本。
Scribe 是全球最準確的語音轉文字模型,支持99種語言。
自動化AI語音代理測試與性能分析平臺,提供真實場景模擬與評估。
致力于通過自然語音技術,打造個人語音伴侶和全天候可穿戴輕量級眼鏡設備。
基于Llama框架的TTS基礎模型,兼容16萬小時標記化語音數據。
音刻轉錄是一款快速、精準、絲滑的音視頻轉錄工具。
Sesame AI 是一款先進的語音合成平臺,能夠生成自然對話式語音并具備情感智能。
一個用于生成對話式語音的模型,支持從文本和音頻輸入生成高質量的語音。
實時語音AI代理,500毫秒內響應語音查詢。
讓應用通過語音與文本的轉換實現智能交互。
個性化AI喚醒服務,助你早起。
將文本轉換為自然流暢的語音輸出
領先的文本到語音轉換模型
快速AI語音助手
將語音轉化為結構化的筆記。
一款用于離線語音轉錄的GUI工具
大規模多語種語音生成數據集
AI語音思維筆記,捕捉靈感,提升行動力。
全端到端的類人語音對話模型
將語音轉化為強大的內容
趣味語音互動,讓設備記住你的名字。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙