AI項目和框架
AndroidLab
AndroidLab是用在訓練和系統評估Android自主代理的框架,集成文本和圖像模態操作環境,統一行動空間和可重現基準測試。AndroidLab支持大型語言模型和多模態模...
Recraft V3
Recraft V3是Recraft公司推出的AI文本到圖像生成模型,在Hugging Face的文本到圖像模型排行榜上以1172的ELO評分榮獲第一。模型具有高質量的圖像生成和先進的...
Magentic-One
Magentic-One 是微軟推出的通用多智能體系統,解決跨領域的復雜網絡和文件任務。系統基于多智能體架構,由Orchestrator智能體領導,協調WebSurfer、FileSurfe...
X-Portrait 2
X-Portrait 2是字節跳動智能創作團隊推出的單圖視頻驅動技術,基于一張靜態照片和一段驅動視頻生成高質量、電影級視頻。X-Portrait 2保留原圖身份特征,準確...
AgentSquare
AgentSquare是清華大學團隊推出自動搜索和優化大型語言模型(LLM)代理的框架?;跇藴驶哪K接口抽象,實現AI智能體的高速自我演化和自適應演進??蚣馨?..
Fashion-VDM
Fashion-VDM是谷歌和華盛頓大學共同推出的基于視頻擴散模型(VDM)的虛擬試穿技術。能在給定服裝圖像和人物視頻的情況下,生成人物穿著指定服裝的高質量試穿...
CogVideoX v1.5
CogVideoX v1.5是智譜最新開源的AI視頻生成模型。模型包含CogVideoX v1.5-5B和CogVideoX v1.5-5B-I2V兩個版本,5B 系列模型支持生成5至10秒、768P分辨率、16...