AI項(xiàng)目和框架
AndroidLab
AndroidLab是用在訓(xùn)練和系統(tǒng)評(píng)估Android自主代理的框架,集成文本和圖像模態(tài)操作環(huán)境,統(tǒng)一行動(dòng)空間和可重現(xiàn)基準(zhǔn)測試。AndroidLab支持大型語言模型和多模態(tài)模...
Recraft V3
Recraft V3是Recraft公司推出的AI文本到圖像生成模型,在Hugging Face的文本到圖像模型排行榜上以1172的ELO評(píng)分榮獲第一。模型具有高質(zhì)量的圖像生成和先進(jìn)的...
Magentic-One
Magentic-One 是微軟推出的通用多智能體系統(tǒng),解決跨領(lǐng)域的復(fù)雜網(wǎng)絡(luò)和文件任務(wù)。系統(tǒng)基于多智能體架構(gòu),由Orchestrator智能體領(lǐng)導(dǎo),協(xié)調(diào)WebSurfer、FileSurfe...
X-Portrait 2
X-Portrait 2是字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)推出的單圖視頻驅(qū)動(dòng)技術(shù),基于一張靜態(tài)照片和一段驅(qū)動(dòng)視頻生成高質(zhì)量、電影級(jí)視頻。X-Portrait 2保留原圖身份特征,準(zhǔn)確...
AgentSquare
AgentSquare是清華大學(xué)團(tuán)隊(duì)推出自動(dòng)搜索和優(yōu)化大型語言模型(LLM)代理的框架。基于標(biāo)準(zhǔn)化的模塊接口抽象,實(shí)現(xiàn)AI智能體的高速自我演化和自適應(yīng)演進(jìn)。框架包...
Fashion-VDM
Fashion-VDM是谷歌和華盛頓大學(xué)共同推出的基于視頻擴(kuò)散模型(VDM)的虛擬試穿技術(shù)。能在給定服裝圖像和人物視頻的情況下,生成人物穿著指定服裝的高質(zhì)量試穿...
CogVideoX v1.5
CogVideoX v1.5是智譜最新開源的AI視頻生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V兩個(gè)版本,5B 系列模型支持生成5至10秒、768P分辨率、16...
粵公網(wǎng)安備 44011502001135號(hào)