AI項目和框架
Hunyuan3D-1.0
Hunyuan3D-1.0 是騰訊推出的一款3D生成模型,具備文本和圖像輸入條件,支持高質量的3D資產生成。該模型采用兩階段方法,首先使用多視角擴散模型生成多視角RGB...
Hunyuan-Large
Hunyuan-Large是騰訊推出的大型混合專家(MoE)模型,具有3890億總參數量和520億激活參數量,是目前業界參數規模最大的開源MoE模型。基于Transformer架構,支...
MagicTailor
MagicTailor 是專門為組件可控個性化設計的新框架,讓T2I模型在個性化過程中能夠精確控制。MagicTailor 基于兩個關鍵技術動態掩碼退化(DM-Deg)和雙流平衡(...
Claude Computer Use
Claude Computer Use是Anthropic公司為Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能,支持AI模型Claude執行類似人類的電腦操作,如查看屏幕、移動光...
Cerebellum
Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver構建的瀏覽器AI智能助手,能理解任務意圖、執行網頁自動化任務,如數據抓取和網站自動化測試。Cerebe...
AndroidLab
AndroidLab是用在訓練和系統評估Android自主代理的框架,集成文本和圖像模態操作環境,統一行動空間和可重現基準測試。AndroidLab支持大型語言模型和多模態模...
Recraft V3
Recraft V3是Recraft公司推出的AI文本到圖像生成模型,在Hugging Face的文本到圖像模型排行榜上以1172的ELO評分榮獲第一。模型具有高質量的圖像生成和先進的...
Magentic-One
Magentic-One 是微軟推出的通用多智能體系統,解決跨領域的復雜網絡和文件任務。系統基于多智能體架構,由Orchestrator智能體領導,協調WebSurfer、FileSurfe...