Toucan TTS
Toucan TTS是由德國斯圖加特大學自然語言處理研究所(IMS)開發的文本到語音合成工具箱,支持超過7000種語言,包括多種方言和變體,提供多說話人語音合成、語...
FreeAskInternet
FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,為用戶提供搜索和智能答案生成服務。
Fish Speech
Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近人類水平的語音合成...
MimicMotion
MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑過渡。此外,MimicM...
FunAudioLLM
FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨識,支持超過50種語...