標簽:語音識別

Aether

Aether 是上海AI Lab開源的生成式世界模型,完全基于合成數據訓練。Aether 首次將三維時空建模與生成式建模深度融合,具備 4D 動態重建、動作條件視頻預測和...
閱讀原文

扣子空間

扣子空間(Coze Space)是字節跳動推出的通用型 AI Agent,幫助用戶快速搭建和管理 AI 應用。通過可視化界面,沒有編程基礎,用戶也能輕松創建。 集成了超過 ...
閱讀原文

EAP Talk

EAP Talk 是基于AI技術的英語口語測評應用,專注于學術英語(EAP)的學習與練習?;诖髷祿⒄Z音識別、自然語言處理等技術,為學生提供實時自動打分和智能...
閱讀原文

破殼AI口語

破殼AI口語是AI英語口語學習應用,基于AI技術為用戶提供個性化口語練習體驗。破殼AI口語涵蓋生活、校園、旅游、職場等多場景對話,幫助用戶提升流利度、語法...
閱讀原文

小布助手

小布助手是OPPO推出的智能語音助手,內置在OPPO、一加、真我realme等機型中。具備語音交互、聯網搜索、系統操作、信息查詢等多種功能。小布助手網頁版正式上...
閱讀原文

心影大模型

心影大模型是心影隨形頂尖AI團隊研發的AI大模型,正式通過國家生成式人工智能服務備案。模型專注于游戲領域,深度融合游戲攻略與角色陪伴場景,全面應用于“逗...
閱讀原文

SeniorTalk

SeniorTalk 是智源研究院聯合南開大學計算機學院人類語言技術實驗室(HLT Lab)推出的全球首個中文超高齡老年人對話語音數據集。數據集包含202位75歲及以上超...
閱讀原文

口語精靈

口語精靈是AI口語學習軟件,通過先進的人工智能技術和真人語音模擬,為用戶提供1V1的對話練習體驗。用戶可以隨時隨地與AI老師互動,跨越國界,學習不同地區的...
閱讀原文

ACTalker

ACTalker 是用于生成逼真說話人頭部視頻的端到端視頻擴散框架。支持單信號或多信號控制,如音頻、表情等。核心架構包括并行 Mamba 結構,通過多個分支利用不...
閱讀原文

OmniTalker

OmniTalker 是阿里巴巴發布的實時文本驅動的說話頭像生成技術,能同時處理文本、圖像、音頻和視頻等多種模態輸入,以流式方式生成自然語音響應。核心架構為 T...

枝頁

枝頁(iBleaf)是基于金字塔原理設計的AI筆記工具,幫助用戶將碎片化的知識整理成清晰有序的知識體系。通過知識樹的形式,讓用戶能以層級化的結構組織筆記,...
閱讀原文

小猿AI

小猿AI是猿輔導集團旗下的智能教育產品,原名小猿口算,接入了DeepSeek滿血版深度推理大模型,具備解題、翻譯、寫作、問答等多種功能,能為學生提供個性化的...

Augment Agent

Augment Agent 是Augment推出的AI編程助手,幫助軟件工程師高效編寫高質量代碼。Augment Agent能深度理解大型代碼庫,隨著用戶工作自動學習和適應代碼風格。
閱讀原文

面靈AI

面靈AI是基于DeepSeek大模型的AI面試助手,專為求職者設計,提升面試表現。具備實時面試輔助功能,能在面試中快速解析問題并給出專業回答建議,能根據簡歷和...
閱讀原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大學(廣州)聯合推出的多模態語言模型優化框架。基于動態調整Kullback-Leibler(KL)散度策略(GRPO-D)和獎勵模型,提升...
閱讀原文
1234515