標簽:實時翻譯
Voice Engine
Voice Engine是OpenAI最新推出的一項AI語音合成和聲音克隆技術,能夠利用簡短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽起來的語音。該項技術自2022年...
Fish Speech
Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近人類水平的語音合成...
Whisper-Medusa
Whisper-Medusa是aiOla推出的開源AI語音識別模型,結合了OpenAI的Whisper技術與aiOla的創新,Whisper-Medusa引入了多頭注意力機制,實現了并行處理,顯著提升...
Qwen2-Audio
Qwen2-Audio是阿里通義千問團隊最新推出的開源AI語音模型,支持直接語音輸入和多語言文本輸出。具備語音聊天、音頻分析功能,支持超過8種語言。Qwen2-Audio在...
STranslate
STranslate是專為Windows用戶設計的多功能翻譯和OCR工具。支持多種語言翻譯,具備劃詞、截圖、監聽剪貼板等多種翻譯方式,并提供多家翻譯服務接口。還擁有基...
VoxInstruct
VoxInstruct 是由清華大學開源的語音合成技術,能根據人類語言指令生成高度符合用戶需求的語音。系統采用統一的多語言編解碼器語言建??蚣埽瑢鹘y的文本到...