標簽:實時翻譯
OmniAudio-2.6B
OmniAudio-2.6B是Nexa AI推出的音頻語言模型,專為邊緣部署設計,能實現快速且高效的音頻文本處理。OmniAudio-2.6B是具有2.6億參數的多模態模型融合Gemma-2-2...
Veo 2:高分辨率4K視頻生成的先進AI模型,助力創意無限
Veo 2 是 Google DeepMind 推出的 AI 視頻生成模型,能根據文本或圖像提示生成高質量視頻內容。Veo 2支持高達 4K 分辨率的視頻制作,理解鏡頭控制指令,能模...
Slides Orator:AI驅動的虛擬解說平臺實現幻燈片內容的即時生動呈現
Slides Orator是創新的AI平臺,基于創建虛擬形象實時展示幻燈片進行解說。工具基于技術生成語音旁白,讓演示內容動態地與觀眾互動,增強演示的吸引力和參與度...
MMAudio:高質量AI音頻合成的多模態聯合訓練技術創新
MMAudio是先進視頻到音頻合成技術,基于多模態聯合訓練,讓模型能在廣泛的視聽和音頻文本數據集上進行訓練。技術的核心是同步模塊,確保生成的音頻與視頻幀精...
GenCast:DeepMind推出的性AI氣象預測模型提氣預報精準度與效率
GenCast是DeepMind推出的革命性AI氣象預測模型,基于擴散模型技術,提供長達15天的全球天氣預報。GenCast在97.2%的預測任務中超越全球頂尖的中期天氣預報系統...
I2V-01-Live:海螺AI創新圖生視頻模型助力創意內容生成與視覺表現提升
I2V-01-Live是海螺AI推出的圖生視頻模型,能將靜態二維圖像轉化為動態視頻。模型基于深度學習技術,增強動作的流暢度和生動性,讓人物或對象的動作更加自然和...
Voice-Pro:一站式音頻處理解決方案集轉錄翻譯與語音合成于一體
Voice-Pro是開源的多功能音頻處理工具,集成語音轉文字(STT)、文本轉語音(TTS)、實時翻譯、YouTube視頻下載和人聲分離等多種功能。工具支持超過100種語言...
聊會小天:智能AI伴侶助您心靈成長與情感支持
聊會小天是由西湖心辰基于自研的西湖大模型推出的AI心理陪伴產品。它結合認知行為療法、敘事療法和人本主義療法,經過近三年的專業訓練,具備心理咨詢技能。...
吱意:智能多模態翻譯與創作平臺助力全球溝通與創意表達
吱意是AI多模態翻譯平臺,提供視頻翻譯、智能配音和音頻轉寫等功能。平臺基于智能語音識別技術和神經網絡翻譯技術,為用戶提供專業高效的視頻在線翻譯服務。...
躍問視頻:智能生成視頻的全新工具助力創意無限
躍問視頻是階躍星辰推出的AI視頻生成工具,支持多種視頻創作主題,例如城市、科幻、自然、跑車、美食等。用戶可以通過躍問視頻官方提供的視頻示例獲得創意靈...
VoicePen.ai:智能內容生成工具助你輕松創建多媒體博客文章
VoicePen.ai 是AI驅動的內容創作工具,能將音頻、視頻、語音備忘錄和網站內容快速轉換成博客文章。VoicePen.ai 用粘貼鏈接或上傳文件,自動生成引人入勝的內...
VoiceCraft
VoiceCraft是一個由德克薩斯大學奧斯汀分校研究團隊開源的神經編解碼器語言模型,專注于零樣本語音編輯和文本到語音(TTS)任務。該模型采用Transformer架構...