AI項目和框架
MetaHuman-Stream
MetaHuman-Stream 是一項前沿的實時交互流式AI數(shù)字人技術(shù),集成了 ERNerf、MuseTalk、Wav2lip 等多種先進模型,支持聲音克隆和深度學習算法,確保對話流暢自...
ComfyUI-Bxb
ComfyUI-Bxb是“SD變現(xiàn)寶”,一鍵把 ComfyUI 工作流轉(zhuǎn)換成小程序,專為小程序開發(fā)者設計,實現(xiàn)快速變現(xiàn)。ComfyUI-Bxb的核心功能是將ComfyUI工作流轉(zhuǎn)換為微信小...
mPLUG-DocOwl2
mPLUG-DocOwl 2是由阿里巴巴通義實驗室mPLUG團隊推出的用于多頁文檔理解的多模態(tài)大型語言模型。在不依賴光學字符識別(OCR)技術(shù)的情況下,通過高分辨率文檔...
Animate Anyone
Animate Anyone是由阿里巴巴智能計算研究院推出的一款將靜態(tài)圖像中的角色或人物進行動態(tài)化的開源框架,該框架在擴散模型的基礎(chǔ)之上,引入了ReferenceNet、Pos...
ReplaceAnything
ReplaceAnything是由阿里巴巴智能計算研究院推出的一款開源AI圖像內(nèi)容替換框架,利用先進的人工智能技術(shù),能夠?qū)崿F(xiàn)對照片或圖像中物體的智能替換。用戶可以通...
Outfit Anyone
Outfit Anyone是由阿里巴巴智能計算研究院推出的一個高質(zhì)量服裝虛擬試穿的開源項目,借助該技術(shù),用戶或模特無需親自試穿衣服即可預覽上身效果。Outfit Anyon...