標簽:智能語音識別

MDT-A2G

MDT-A2G是復旦大學和騰訊優圖聯合推出的AI模型,專門用于根據語音內容同步生成相應的手勢動作。MDT-A2G模仿人類在交流時自然產生的手勢,計算機能更加生動和...
閱讀原文

曉象

曉象是光啟慧語推出的AI克隆產品,基于自研可信大模型,創建各領域知識博主的AI分身。模擬知識博主的聲音、風格和表達方式,生成個性化的內容。
閱讀原文

GLM-4V-Plus

GLM-4V-Plus是智譜AI最新推出的多模態AI模型,專注于圖像和視頻理解。GLM-4V-Plus不僅能夠精確分析靜態圖像,還具備動態視頻內容的時間感知和理解能力,能捕...
閱讀原文

Step-1X

Step-1X 是階躍星辰推出的AI圖像生成大模型,采用自研的 DiT 架構,擅長深度語義理解和細節生成。Step-1X支持長達2000字符的復雜指令,能精準匹配圖文,適用...
閱讀原文

Dinox

Dinox是基于AI技術的語音筆記應用,通過實時語音轉錄功能,幫助用戶快速記錄靈感和信息。Dinox的特點包括本地優先存儲、多平臺同步、智能生成筆記標題和分類...
閱讀原文

云界AI

云界AI是開源在線AI繪畫工具,集成了文生圖、圖生圖、條件生圖和模型訓練等多種創意生圖功能。用戶通過簡單的文本描述或上傳圖片,快速生成具有創意的藝術作品。
閱讀原文

Zeemo

Zeemo 是一款AI驅動的視頻字幕生成工具,能自動檢測并轉錄多達95種語言的語音,將字幕翻譯成113種語言。工具為視頻創作者提供快速、高效的方式增加視頻的全球...
閱讀原文

我在AI

我在AI是一款先進的AI智能體聊天平臺,基于AI技術,特別是自然語言處理(NLP),實現與人的自然語言對話,回答各種問題,給予情感支持。用戶定制個性化的AI智...
閱讀原文

百度智能云一見

百度智能云一見是百度智能云推出的視覺大模型平臺,旨在基于領先的視覺大模型技術和豐富的場景化算法方案,實現專業級視覺AI應用的平民化。平臺打通從模型生...
閱讀原文

MM1.5

MM1.5是蘋果公司推出的多模態大型語言模型,旨在增強文本豐富圖像理解、視覺指代和定位以及多圖像推理能力。模型基于數據為中心的訓練方法,在大規模預訓練、...
閱讀原文

YouTube Transcript

YouTube Transcript是一個基于AI技術自動生成YouTube視頻文字記錄的在線服務。支持用戶將視頻內容轉換成文字稿,便于內容創作者添加字幕、學生和研究人員簡化...
閱讀原文

ssemble

ssemble是一款運用人工智能技術的在線視頻編輯平臺,能將長視頻智能切割成適合短視頻平臺的內容。通過AI驅動的內容識別,ssemble快速定位視頻中的高光時刻,...
閱讀原文

Mellum

Mellum 是 JetBrains 推出的一款專為開發者設計的大型語言模型(LLM),旨在提升 AI 驅動的開發工具。通過深度集成 JetBrains IDE,提供低延遲、高準確度的代...
閱讀原文

Whispo

Whispo是AI驅動的語音轉錄工具,支持用戶按住Ctrl鍵錄制語音,在釋放鍵時自動將轉錄的文本插入到正在用的任何支持文本輸入的應用程序中。工具的數據處理完全...
閱讀原文

訊飛星火PC版

訊飛星火PC版是科大訊飛推出的電腦端AI對話產品,具備強大的跨領域知識理解和語言處理能力。通過自然對話方式,用戶可以進行寫作、搜索、問答、翻譯等多種任...
閱讀原文