標簽:語音識別
什么是NLP自然語言處理?定義、重要性、發展和應用
NLP(Natural Language Processing),即自然語言處理,是計算機科學的一個領域,重點是創建能夠理解人類語音和語言的計算機和軟件。NLP使用人工智能和機器學...
VoiceCraft
VoiceCraft是一個由德克薩斯大學奧斯汀分校研究團隊開源的神經編解碼器語言模型,專注于零樣本語音編輯和文本到語音(TTS)任務。該模型采用Transformer架構...
Voice Engine
Voice Engine是OpenAI最新推出的一項AI語音合成和聲音克隆技術,能夠利用簡短的15秒音頻樣本和文本輸入,生成接近原聲的自然聽起來的語音。該項技術自2022年...
Fish Speech
Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近人類水平的語音合成...
Whisper-Medusa
Whisper-Medusa是aiOla推出的開源AI語音識別模型,結合了OpenAI的Whisper技術與aiOla的創新,Whisper-Medusa引入了多頭注意力機制,實現了并行處理,顯著提升...
智譜AI開放平臺
智譜AI開放平臺 是一個面向開發者的大模型開發平臺。整合了先進的模型能力、豐富的開發資源、自定義知識庫及應用體驗中心,助力開發者利用GLM大模型的技術潛...