標簽:語音識別
Readtheirlips
Readtheirlips 是由 Symphonic Labs 推出的一款AI軟件,用于通過分析視頻中人物的嘴唇運動來識別和轉(zhuǎn)錄口語內(nèi)容。軟件能解讀在沒有聲音的情況下,或者在聲音...
TikTok Voice
TikTok Voice 是基于AI技術的文字轉(zhuǎn)語音(TTS)在線工具,將文本轉(zhuǎn)換成各種流行于TikTok平臺的聲音效果。工具為用戶提供多種語音選項,如女士聲音、Siri聲音...
Faster Whisper
Faster Whisper 是一個基于OpenAI Whisper模型的高效語音識別工具,運用CTranslate2引擎實現(xiàn)快速推理。在保持高準確度的同時,提升語音轉(zhuǎn)寫速度,降低內(nèi)存使...
Draw an Audio
Draw an Audio 是中國科學院自動化研究所和美團點評的研究人員推出的視頻生成音頻系統(tǒng)。根據(jù)視頻內(nèi)容自動生成匹配的聲音效果,類似于電影制作中的 Foley 藝術...