標(biāo)簽:多語(yǔ)言支持
GLM-Realtime
GLM-Realtime是智譜推出的全新端到端多模態(tài)模型,具備低延遲的視頻理解與語(yǔ)音交互能力,特別融入清唱功能,讓大模型在對(duì)話中能展現(xiàn)歌唱才能。模型支持長(zhǎng)達(dá)2分...
Kokoro-TTS
Kokoro-TTS 是 hexgrad 開(kāi)發(fā)的輕量級(jí)文本轉(zhuǎn)語(yǔ)音(TTS)模型,具有 8200 萬(wàn)參數(shù)。基于 StyleTTS 2 和 ISTFTNet 的混合架構(gòu),采用純解碼器設(shè)計(jì),不使用擴(kuò)散模型...
星火語(yǔ)音同傳大模型
星火語(yǔ)音同傳大模型是科大訊飛于2025年1月15日發(fā)布的國(guó)內(nèi)首個(gè)具備端到端語(yǔ)音同傳能力的大模型。模型在內(nèi)容完整度、信息準(zhǔn)確度以及語(yǔ)言質(zhì)量上均處于行業(yè)領(lǐng)先水...
粵公網(wǎng)安備 44011502001135號(hào)