標(biāo)簽:語音識別
SeniorTalk
SeniorTalk 是智源研究院聯(lián)合南開大學(xué)計算機(jī)學(xué)院人類語言技術(shù)實(shí)驗(yàn)室(HLT Lab)推出的全球首個中文超高齡老年人對話語音數(shù)據(jù)集。數(shù)據(jù)集包含202位75歲及以上超...
OmniTalker
OmniTalker 是阿里巴巴發(fā)布的實(shí)時文本驅(qū)動的說話頭像生成技術(shù),能同時處理文本、圖像、音頻和視頻等多種模態(tài)輸入,以流式方式生成自然語音響應(yīng)。核心架構(gòu)為 T...
小猿AI
小猿AI是猿輔導(dǎo)集團(tuán)旗下的智能教育產(chǎn)品,原名小猿口算,接入了DeepSeek滿血版深度推理大模型,具備解題、翻譯、寫作、問答等多種功能,能為學(xué)生提供個性化的...
Augment Agent
Augment Agent 是Augment推出的AI編程助手,幫助軟件工程師高效編寫高質(zhì)量代碼。Augment Agent能深度理解大型代碼庫,隨著用戶工作自動學(xué)習(xí)和適應(yīng)代碼風(fēng)格。
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大學(xué)(廣州)聯(lián)合推出的多模態(tài)語言模型優(yōu)化框架。基于動態(tài)調(diào)整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...