AI項(xiàng)目和框架
Ferret-UI 2
Ferret-UI 2是蘋果公司推出的多模態(tài)大型語(yǔ)言模型,用在理解和交互移動(dòng)用戶界面。Ferret-UI 2能識(shí)別和理解各種移動(dòng)設(shè)備屏幕上的UI元素,執(zhí)行復(fù)雜的用戶指令,...
MMBench-Video
MMBench-Video是新穎的長(zhǎng)視頻多題問答基準(zhǔn)測(cè)試,是浙江大學(xué)、上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)和香港中文大學(xué)聯(lián)合推出的。MMBench-Video能全面評(píng)估大型視覺...
DistilQwen2
DistilQwen2是基于Qwen2大模型用知識(shí)蒸餾技術(shù)優(yōu)化得到的輕量級(jí)語(yǔ)言模型,能提高運(yùn)算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增強(qiáng)指令數(shù)據(jù)多樣性...
Hunyuan3D-1.0
Hunyuan3D-1.0 是騰訊推出的一款3D生成模型,具備文本和圖像輸入條件,支持高質(zhì)量的3D資產(chǎn)生成。該模型采用兩階段方法,首先使用多視角擴(kuò)散模型生成多視角RGB...
Hunyuan-Large
Hunyuan-Large是騰訊推出的大型混合專家(MoE)模型,具有3890億總參數(shù)量和520億激活參數(shù)量,是目前業(yè)界參數(shù)規(guī)模最大的開源MoE模型。基于Transformer架構(gòu),支...
MagicTailor
MagicTailor 是專門為組件可控個(gè)性化設(shè)計(jì)的新框架,讓T2I模型在個(gè)性化過程中能夠精確控制。MagicTailor 基于兩個(gè)關(guān)鍵技術(shù)動(dòng)態(tài)掩碼退化(DM-Deg)和雙流平衡(...
Claude Computer Use
Claude Computer Use是Anthropic公司為Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能,支持AI模型Claude執(zhí)行類似人類的電腦操作,如查看屏幕、移動(dòng)光...
Cerebellum
Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver構(gòu)建的瀏覽器AI智能助手,能理解任務(wù)意圖、執(zhí)行網(wǎng)頁(yè)自動(dòng)化任務(wù),如數(shù)據(jù)抓取和網(wǎng)站自動(dòng)化測(cè)試。Cerebe...
粵公網(wǎng)安備 44011502001135號(hào)