AI項目和框架
FreeAskInternet
FreeAskInternet是一個免費開源的本地AI搜索引擎,整合了GPT-3.5等先進的大型語言模型(LLM)和SearXNG元搜索引擎,為用戶提供搜索和智能答案生成服務。
Fish Speech
Fish Speech是一款由Fish Audio開發的開源的文本到語音(TTS)工具,支持中文、英文和日文。通過約15萬小時的多語種數據訓練,實現了接近人類水平的語音合成...
MimicMotion
MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑過渡。此外,MimicM...
FunAudioLLM
FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨識,支持超過50種語...
LivePortrait
LivePortrait是快手推出的開源人像動畫生成框架,專注于高效、可控地將驅動視頻的表情和姿態遷移至靜態或動態人像,創造出富有表現力的視頻。該技術通過隱式...
GPT-4o Long Output模型
GPT-4o Long Output模型是OpenAI最新推出的超長輸出AI模型,支持高達64k tokens的長文本輸出,相當于約200頁小說。相較于原GPT-4o模型,輸出能力提升16倍,但...
MindSearch
MindSearch是上海人工智能實驗室聯合研發團隊推出的開源AI搜索框架,結合了大規模信息搜集和整理能力。利用InternLM2.5 7B對話模型,MindSearch能在3分鐘內從...
粵公網安備 44011502001135號