AI項目和框架
Whisper-Medusa
Whisper-Medusa是aiOla推出的開源AI語音識別模型,結合了OpenAI的Whisper技術與aiOla的創新,Whisper-Medusa引入了多頭注意力機制,實現了并行處理,顯著提升...
FoleyCrafter
FoleyCrafter是上海人工智能實驗室和香港中文大學(深圳)共同推出的AI視頻配音框架,FoleyCrafter能自動聽出視頻中的動作,配上恰到好處的聲音效果。不管是...
PhotoMaker V2
PhotoMaker V2是騰訊推出的AI圖像生成框架,能在極短的時間內生成逼真的人物照片。與初代相比,V2版本在角色的一致性和可控性上實現了顯著提升,用戶可以通過...
SEED-Story
SEED-Story是騰訊聯合香港科技大學、香港中文大學推出的多模態故事生成模型。基于多模態大語言模型(MLLM),能預測文本和視覺token,通過視覺de-tokenizer生...
EasyAnimate
EasyAnimate是阿里推出的AI視頻生成工具,支持文生視頻和圖生視頻兩種方式,用戶可以上傳圖片作為視頻的起始和結束畫面,實現更靈活的視頻編輯。EasyAnimate...
Qwen2-Math
Qwen2-Math是阿里通義千問推出的基于Qwen2語言模型構建的數學解題專用開源AI模型,專為解決復雜數學問題設計。經過數學專用語料庫的預訓練和指令微調,表現出...