AI項目和框架
Ferret-UI 2
Ferret-UI 2是蘋果公司推出的多模態大型語言模型,用在理解和交互移動用戶界面。Ferret-UI 2能識別和理解各種移動設備屏幕上的UI元素,執行復雜的用戶指令,...
MMBench-Video
MMBench-Video是新穎的長視頻多題問答基準測試,是浙江大學、上海人工智能實驗室、上海交通大學和香港中文大學聯合推出的。MMBench-Video能全面評估大型視覺...
DistilQwen2
DistilQwen2是基于Qwen2大模型用知識蒸餾技術優化得到的輕量級語言模型,能提高運算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增強指令數據多樣性...
Hunyuan3D-1.0
Hunyuan3D-1.0 是騰訊推出的一款3D生成模型,具備文本和圖像輸入條件,支持高質量的3D資產生成。該模型采用兩階段方法,首先使用多視角擴散模型生成多視角RGB...
Hunyuan-Large
Hunyuan-Large是騰訊推出的大型混合專家(MoE)模型,具有3890億總參數量和520億激活參數量,是目前業界參數規模最大的開源MoE模型。基于Transformer架構,支...
MagicTailor
MagicTailor 是專門為組件可控個性化設計的新框架,讓T2I模型在個性化過程中能夠精確控制。MagicTailor 基于兩個關鍵技術動態掩碼退化(DM-Deg)和雙流平衡(...
Claude Computer Use
Claude Computer Use是Anthropic公司為Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能,支持AI模型Claude執行類似人類的電腦操作,如查看屏幕、移動光...
Cerebellum
Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver構建的瀏覽器AI智能助手,能理解任務意圖、執行網頁自動化任務,如數據抓取和網站自動化測試。Cerebe...