標(biāo)簽:語音識別
Qwen2-Audio
Qwen2-Audio是阿里通義千問團(tuán)隊最新推出的開源AI語音模型,支持直接語音輸入和多語言文本輸出。具備語音聊天、音頻分析功能,支持超過8種語言。Qwen2-Audio在...
Subtitle Edit
Subtitle Edit是一款免費開源的多功能字幕編輯器,支持超過300種字幕格式,包括SRT、MicroDVD和Sub Station Alpha等。具備字幕同步、創(chuàng)建、翻譯、音頻波形可...
STranslate
STranslate是專為Windows用戶設(shè)計的多功能翻譯和OCR工具。支持多種語言翻譯,具備劃詞、截圖、監(jiān)聽剪貼板等多種翻譯方式,并提供多家翻譯服務(wù)接口。還擁有基...
VoxInstruct
VoxInstruct 是由清華大學(xué)開源的語音合成技術(shù),能根據(jù)人類語言指令生成高度符合用戶需求的語音。系統(tǒng)采用統(tǒng)一的多語言編解碼器語言建模框架,將傳統(tǒng)的文本到...