標(biāo)簽:智能語(yǔ)音識(shí)別

Dinox

Dinox是基于AI技術(shù)的語(yǔ)音筆記應(yīng)用,通過(guò)實(shí)時(shí)語(yǔ)音轉(zhuǎn)錄功能,幫助用戶(hù)快速記錄靈感和信息。Dinox的特點(diǎn)包括本地優(yōu)先存儲(chǔ)、多平臺(tái)同步、智能生成筆記標(biāo)題和分類(lèi)...
閱讀原文

云界AI

云界AI是開(kāi)源在線(xiàn)AI繪畫(huà)工具,集成了文生圖、圖生圖、條件生圖和模型訓(xùn)練等多種創(chuàng)意生圖功能。用戶(hù)通過(guò)簡(jiǎn)單的文本描述或上傳圖片,快速生成具有創(chuàng)意的藝術(shù)作品。
閱讀原文

Zeemo

Zeemo 是一款A(yù)I驅(qū)動(dòng)的視頻字幕生成工具,能自動(dòng)檢測(cè)并轉(zhuǎn)錄多達(dá)95種語(yǔ)言的語(yǔ)音,將字幕翻譯成113種語(yǔ)言。工具為視頻創(chuàng)作者提供快速、高效的方式增加視頻的全球...
閱讀原文

我在AI

我在AI是一款先進(jìn)的AI智能體聊天平臺(tái),基于AI技術(shù),特別是自然語(yǔ)言處理(NLP),實(shí)現(xiàn)與人的自然語(yǔ)言對(duì)話(huà),回答各種問(wèn)題,給予情感支持。用戶(hù)定制個(gè)性化的AI智...
閱讀原文

百度智能云一見(jiàn)

百度智能云一見(jiàn)是百度智能云推出的視覺(jué)大模型平臺(tái),旨在基于領(lǐng)先的視覺(jué)大模型技術(shù)和豐富的場(chǎng)景化算法方案,實(shí)現(xiàn)專(zhuān)業(yè)級(jí)視覺(jué)AI應(yīng)用的平民化。平臺(tái)打通從模型生...
閱讀原文

MM1.5

MM1.5是蘋(píng)果公司推出的多模態(tài)大型語(yǔ)言模型,旨在增強(qiáng)文本豐富圖像理解、視覺(jué)指代和定位以及多圖像推理能力。模型基于數(shù)據(jù)為中心的訓(xùn)練方法,在大規(guī)模預(yù)訓(xùn)練、...
閱讀原文

YouTube Transcript

YouTube Transcript是一個(gè)基于AI技術(shù)自動(dòng)生成YouTube視頻文字記錄的在線(xiàn)服務(wù)。支持用戶(hù)將視頻內(nèi)容轉(zhuǎn)換成文字稿,便于內(nèi)容創(chuàng)作者添加字幕、學(xué)生和研究人員簡(jiǎn)化...
閱讀原文

ssemble

ssemble是一款運(yùn)用人工智能技術(shù)的在線(xiàn)視頻編輯平臺(tái),能將長(zhǎng)視頻智能切割成適合短視頻平臺(tái)的內(nèi)容。通過(guò)AI驅(qū)動(dòng)的內(nèi)容識(shí)別,ssemble快速定位視頻中的高光時(shí)刻,...
閱讀原文

Mellum

Mellum 是 JetBrains 推出的一款專(zhuān)為開(kāi)發(fā)者設(shè)計(jì)的大型語(yǔ)言模型(LLM),旨在提升 AI 驅(qū)動(dòng)的開(kāi)發(fā)工具。通過(guò)深度集成 JetBrains IDE,提供低延遲、高準(zhǔn)確度的代...
閱讀原文

Whispo

Whispo是AI驅(qū)動(dòng)的語(yǔ)音轉(zhuǎn)錄工具,支持用戶(hù)按住Ctrl鍵錄制語(yǔ)音,在釋放鍵時(shí)自動(dòng)將轉(zhuǎn)錄的文本插入到正在用的任何支持文本輸入的應(yīng)用程序中。工具的數(shù)據(jù)處理完全...
閱讀原文

訊飛星火PC版

訊飛星火PC版是科大訊飛推出的電腦端AI對(duì)話(huà)產(chǎn)品,具備強(qiáng)大的跨領(lǐng)域知識(shí)理解和語(yǔ)言處理能力。通過(guò)自然對(duì)話(huà)方式,用戶(hù)可以進(jìn)行寫(xiě)作、搜索、問(wèn)答、翻譯等多種任...
閱讀原文

咔噠

咔噠是基于AI技術(shù)的智能圖片處理軟件。能識(shí)別各種場(chǎng)景和物體,自動(dòng)為照片匹配合適的濾鏡和效果,快速提升照片質(zhì)量。咔噠AI能針對(duì)不同場(chǎng)景進(jìn)行優(yōu)化,如夜景和...
閱讀原文

芊芊妙音

芊芊妙音是AI配音和變聲軟件,提供豐富的音色包和音頻處理功能,讓用戶(hù)輕松改變自己的聲音,進(jìn)行配音創(chuàng)作。軟件用海量音色包、文字提取功能、作品保存與分享...
閱讀原文

SlideSpeak

SlideSpeak是AI驅(qū)動(dòng)平臺(tái),專(zhuān)門(mén)設(shè)計(jì)來(lái)增強(qiáng)用戶(hù)處理演示文稿和文檔的能力。允許用戶(hù)上傳PowerPoint、Word或PDF文件,用人工智能快速生成演示文稿或提取文檔摘要...
閱讀原文

Hertz-Dev

Hertz-Dev是Standard Intelligence推出的開(kāi)源音頻模型,擁有8.5億參數(shù)。Hertz-Dev包括音頻自動(dòng)編碼器hertz-codec、音頻VAE學(xué)習(xí)先驗(yàn)hertz-vae和一個(gè)66億參數(shù)的...
閱讀原文