標(biāo)簽:實(shí)時(shí)翻譯

AI解說(shuō)大師

AI解說(shuō)大師是智能影視創(chuàng)作工具,基于先進(jìn)的數(shù)字技術(shù)和AI大模型,讓用戶能夠輕松生成原創(chuàng)解說(shuō)視頻。工具具備正版影視素材庫(kù)、自動(dòng)生成解說(shuō)文案、音頻和字幕智...

Draw an Audio

Draw an Audio 是中國(guó)科學(xué)院自動(dòng)化研究所和美團(tuán)點(diǎn)評(píng)的研究人員推出的視頻生成音頻系統(tǒng)。根據(jù)視頻內(nèi)容自動(dòng)生成匹配的聲音效果,類(lèi)似于電影制作中的 Foley 藝術(shù)...
閱讀原文

Comic Translate

Comic Translate 是一個(gè)開(kāi)源的漫畫(huà)翻譯工具,由開(kāi)發(fā)者 ogkalu2 推出。幫助用戶自動(dòng)翻譯全球各地的漫畫(huà),支持英語(yǔ)、韓語(yǔ)、日語(yǔ)、法語(yǔ)、簡(jiǎn)體中文、繁體中文、俄...
閱讀原文

Rope

Rope是一款開(kāi)源的AI換臉工具,基于insightface的inswapper_128模型構(gòu)建,提供一個(gè)用戶友好的圖形界面。用戶通過(guò)上傳圖片或視頻,在幾秒鐘內(nèi)完成換臉操作,效...
閱讀原文

Zeemo

Zeemo 是一款A(yù)I驅(qū)動(dòng)的視頻字幕生成工具,能自動(dòng)檢測(cè)并轉(zhuǎn)錄多達(dá)95種語(yǔ)言的語(yǔ)音,將字幕翻譯成113種語(yǔ)言。工具為視頻創(chuàng)作者提供快速、高效的方式增加視頻的全球...
閱讀原文

RTranslator

RTranslator 是一款開(kāi)源、免費(fèi)、離線實(shí)時(shí)翻譯應(yīng)用程序,專(zhuān)為 Android 設(shè)備設(shè)計(jì)。基于先進(jìn)的AI技術(shù),包括 Meta 的 NLLB 翻譯模型和 OpenAI 的 Whisper 語(yǔ)音識(shí)...
閱讀原文

ssemble

ssemble是一款運(yùn)用人工智能技術(shù)的在線視頻編輯平臺(tái),能將長(zhǎng)視頻智能切割成適合短視頻平臺(tái)的內(nèi)容。通過(guò)AI驅(qū)動(dòng)的內(nèi)容識(shí)別,ssemble快速定位視頻中的高光時(shí)刻,...
閱讀原文

Whispo

Whispo是AI驅(qū)動(dòng)的語(yǔ)音轉(zhuǎn)錄工具,支持用戶按住Ctrl鍵錄制語(yǔ)音,在釋放鍵時(shí)自動(dòng)將轉(zhuǎn)錄的文本插入到正在用的任何支持文本輸入的應(yīng)用程序中。工具的數(shù)據(jù)處理完全...
閱讀原文

Talkie

Talkie是中國(guó)大模型廠商MiniMax面向海外市場(chǎng)推出的AI虛擬伴侶應(yīng)用,為用戶提供高度個(gè)性化和沉浸式的互動(dòng)體驗(yàn)。用戶可以創(chuàng)建和定制虛擬角色,包括外觀、聲音和...
閱讀原文

VERBALATE

VERBALATE是AI視頻翻譯和配音工具,能將視頻內(nèi)容轉(zhuǎn)換成多種語(yǔ)言,同時(shí)實(shí)現(xiàn)口型同步。用戶可以上傳視頻,選擇目標(biāo)語(yǔ)言,VERBALATE能自動(dòng)處理生成帶有新語(yǔ)音和...
閱讀原文

Manga Translator

Manga Translator是Chrome瀏覽器擴(kuò)展程序,能幫助用戶快速翻譯漫畫(huà)中的對(duì)話框文字。工具基于AI技術(shù),支持將漫畫(huà)、掃描和圖像翻譯成135種以上不同的語(yǔ)言(包括...
閱讀原文

MobileLLM

MobileLLM是Meta為移動(dòng)設(shè)備用例優(yōu)化設(shè)計(jì)的十億參數(shù)以下的大型語(yǔ)言模型,能解決云成本上升和延遲問(wèn)題。MobileLLM基于深薄架構(gòu)、嵌入共享和分組查詢注意力機(jī)制...
閱讀原文

SlideSpeak

SlideSpeak是AI驅(qū)動(dòng)平臺(tái),專(zhuān)門(mén)設(shè)計(jì)來(lái)增強(qiáng)用戶處理演示文稿和文檔的能力。允許用戶上傳PowerPoint、Word或PDF文件,用人工智能快速生成演示文稿或提取文檔摘要...
閱讀原文

Hertz-Dev

Hertz-Dev是Standard Intelligence推出的開(kāi)源音頻模型,擁有8.5億參數(shù)。Hertz-Dev包括音頻自動(dòng)編碼器hertz-codec、音頻VAE學(xué)習(xí)先驗(yàn)hertz-vae和一個(gè)66億參數(shù)的...
閱讀原文

AndroidLab

AndroidLab是用在訓(xùn)練和系統(tǒng)評(píng)估Android自主代理的框架,集成文本和圖像模態(tài)操作環(huán)境,統(tǒng)一行動(dòng)空間和可重現(xiàn)基準(zhǔn)測(cè)試。AndroidLab支持大型語(yǔ)言模型和多模態(tài)模...
閱讀原文
13456