標簽:語音識別
SeniorTalk
SeniorTalk 是智源研究院聯合南開大學計算機學院人類語言技術實驗室(HLT Lab)推出的全球首個中文超高齡老年人對話語音數據集。數據集包含202位75歲及以上超...
OmniTalker
OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...
小猿AI
小猿AI是猿輔導集團旗下的智能教育產品,原名小猿口算,接入了DeepSeek滿血版深度推理大模型,具備解題、翻譯、寫作、問答等多種功能,能為學生提供個性化的...
Augment Agent
Augment Agent 是Augment推出的AI編程助手,幫助軟件工程師高效編寫高質量代碼。Augment Agent能深度理解大型代碼庫,隨著用戶工作自動學習和適應代碼風格。
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大學(廣州)聯合推出的多模態語言模型優化框架。基于動態調整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...