標簽:語音識別
PaddleSpeech
PaddleSpeech 是百度飛槳團隊開源的語音處理工具,提供全面的語音處理功能,包括語音識別、語音合成、聲紋識別、語音翻譯等。PaddleSpeech提供命令行界面、服...
AndroidGen
AndroidGen 是智譜技術團隊推出增強基于大語言模型(LLM)的 Agent 能力的框架,特別是在數據稀缺的情況下。框架通過收集人類任務軌跡基于這些軌跡訓練語言模...
Open-Sora 2.0
Open-Sora 2.0 是潞晨科技推出的全新開源SOTA(State-of-the-Art)視頻生成模型。Open-Sora 2.0 用 20 萬美元(224 張 GPU)成功訓練出 11B 參數的商業級模型...
Tough Tongue AI 2.0
Tough Tongue AI 2.0 是多模態對話練習工具,幫助用戶應對各種困難對話場景而設計。支持創建和分享多種對話場景,如面試、職場溝通、銷售談判等,提供智能對...
TicVoice 7.0
TicVoice 7.0 是出門問問推出的第七代高品質 TTS(語音合成)引擎,基于新一代語音生成模型 Spark-TTS 。TicVoice 7.0基于創新的 BiCodec 編碼方式,將語音分...
WhisperChain
WhisperChain 是開源的語音識別工具,基于語音輸入提升工作效率。WhisperChain用 Whisper.cpp 實現實時語音識別,將語音轉換為文本,基于 LangChain 對文本進...