Deep Research
Deep Research是OpenAI推出的新型AI深度搜索研究工具,專為需要深度、復(fù)雜研究的用戶設(shè)計(jì)。能在短時(shí)間內(nèi)(5到30分鐘)完成人類專家需要數(shù)小時(shí)甚至數(shù)天才能完...
RealtimeSTT
RealtimeSTT是開源的實(shí)時(shí)語音轉(zhuǎn)文本庫,專為低延遲應(yīng)用設(shè)計(jì)。有強(qiáng)大的語音活動(dòng)檢測(cè)功能,可自動(dòng)識(shí)別說話的開始與結(jié)束,通過WebRTCVAD和SileroVAD進(jìn)行精準(zhǔn)檢測(cè)...
Step R-mini
Step R-mini(全稱Step Reasoner mini)是階躍星辰推出的推理模型, 是 Step 系列模型家族的首個(gè)推理模型,擅長(zhǎng)主動(dòng)規(guī)劃、嘗試和反思,基于慢思考和反復(fù)驗(yàn)證...
GLM-Realtime
GLM-Realtime是智譜推出的全新端到端多模態(tài)模型,具備低延遲的視頻理解與語音交互能力,特別融入清唱功能,讓大模型在對(duì)話中能展現(xiàn)歌唱才能。模型支持長(zhǎng)達(dá)2分...
CogView-3-Flash
CogView-3-Flash 是智譜推出的首個(gè)免費(fèi)AI圖像生成模型,能根據(jù)文本描述生成高審美分?jǐn)?shù)的圖像,支持多種分辨率,滿足專業(yè)領(lǐng)域需求。模型具備創(chuàng)意多樣性,基于...
Product Avatar
Product Avatar 是 TopView 推出的 AI 工具,能將產(chǎn)品圖片轉(zhuǎn)化為由虛擬人物手持展示的視頻。用戶只需上傳產(chǎn)品圖片,選擇虛擬人物模板,AI 能生成逼真的展示視...
Kokoro-TTS
Kokoro-TTS 是 hexgrad 開發(fā)的輕量級(jí)文本轉(zhuǎn)語音(TTS)模型,具有 8200 萬參數(shù)。基于 StyleTTS 2 和 ISTFTNet 的混合架構(gòu),采用純解碼器設(shè)計(jì),不使用擴(kuò)散模型...