Deep Research
Deep Research是OpenAI推出的新型AI深度搜索研究工具,專為需要深度、復雜研究的用戶設計。能在短時間內(5到30分鐘)完成人類專家需要數小時甚至數天才能完...
RealtimeSTT
RealtimeSTT是開源的實時語音轉文本庫,專為低延遲應用設計。有強大的語音活動檢測功能,可自動識別說話的開始與結束,通過WebRTCVAD和SileroVAD進行精準檢測...
Step R-mini
Step R-mini(全稱Step Reasoner mini)是階躍星辰推出的推理模型, 是 Step 系列模型家族的首個推理模型,擅長主動規劃、嘗試和反思,基于慢思考和反復驗證...
GLM-Realtime
GLM-Realtime是智譜推出的全新端到端多模態模型,具備低延遲的視頻理解與語音交互能力,特別融入清唱功能,讓大模型在對話中能展現歌唱才能。模型支持長達2分...
CogView-3-Flash
CogView-3-Flash 是智譜推出的首個免費AI圖像生成模型,能根據文本描述生成高審美分數的圖像,支持多種分辨率,滿足專業領域需求。模型具備創意多樣性,基于...
Product Avatar
Product Avatar 是 TopView 推出的 AI 工具,能將產品圖片轉化為由虛擬人物手持展示的視頻。用戶只需上傳產品圖片,選擇虛擬人物模板,AI 能生成逼真的展示視...
Kokoro-TTS
Kokoro-TTS 是 hexgrad 開發的輕量級文本轉語音(TTS)模型,具有 8200 萬參數。基于 StyleTTS 2 和 ISTFTNet 的混合架構,采用純解碼器設計,不使用擴散模型...