AI項(xiàng)目和框架
ID-Animator
ID-Animator是由來自騰訊光子工作室、中科大和中科院合肥物質(zhì)科學(xué)研究院的研究人員推出的一種零樣本(zero-shot)人類視頻生成技術(shù),能夠根據(jù)單張參考面部圖...
VideoGigaGAN
VideoGigaGAN是由Adobe和馬里蘭大學(xué)的研究人員提出的一種新型的生成式視頻超分辨率(VSR)模型,最高可將視頻分辨率提升8倍,將模糊的視頻放大為具有豐富細(xì)節(jié)...
Universal-1
Universal-1是AI語(yǔ)音初創(chuàng)公司AssemblyAI推出的一款多語(yǔ)言語(yǔ)音識(shí)別和轉(zhuǎn)錄模型,經(jīng)過超過1250萬(wàn)小時(shí)的多語(yǔ)種音頻數(shù)據(jù)訓(xùn)練,支持英語(yǔ)、西班牙語(yǔ)、法語(yǔ)和德語(yǔ)等。