AI項(xiàng)目和框架

HiCo

HiCo是360 AI研究院推出的基于擴(kuò)散模型的層次化可控布局到圖像生成模型,HiCo基于多分支結(jié)構(gòu)設(shè)計(jì),實(shí)現(xiàn)對(duì)對(duì)象位置和文本描述的精確控制。HiCo的關(guān)鍵特點(diǎn)在于...
閱讀原文

Ferret-UI 2

Ferret-UI 2是蘋果公司推出的多模態(tài)大型語(yǔ)言模型,用在理解和交互移動(dòng)用戶界面。Ferret-UI 2能識(shí)別和理解各種移動(dòng)設(shè)備屏幕上的UI元素,執(zhí)行復(fù)雜的用戶指令,...
閱讀原文

MMBench-Video

MMBench-Video是新穎的長(zhǎng)視頻多題問答基準(zhǔn)測(cè)試,是浙江大學(xué)、上海人工智能實(shí)驗(yàn)室、上海交通大學(xué)和香港中文大學(xué)聯(lián)合推出的。MMBench-Video能全面評(píng)估大型視覺...
閱讀原文

MiniMates

MiniMates是高性能的輕量級(jí)數(shù)字人驅(qū)動(dòng)算法,具備語(yǔ)音和表情兩種驅(qū)動(dòng)模式,能在普通電腦上實(shí)現(xiàn)實(shí)時(shí)運(yùn)行。基于先進(jìn)的技術(shù)架構(gòu),提供極致的速度體驗(yàn)和個(gè)性化定制...
閱讀原文

MotionCLR

MotionCLR是基于注意力機(jī)制的人體動(dòng)作生成和編輯模型,能根據(jù)文本提示生成動(dòng)作,支持用戶進(jìn)行交互式編輯,如動(dòng)作強(qiáng)調(diào)、減弱、替換、擦除和風(fēng)格轉(zhuǎn)移。MotionCL...
閱讀原文

DocMind

DocMind是司馬閱推出的文檔智能大模型,基于Transformer結(jié)構(gòu),融合深度學(xué)習(xí)、NLP和CV技術(shù),能處理富文本文檔的復(fù)雜結(jié)構(gòu)和視覺信息,提高信息抽取準(zhǔn)確性。DocM...
閱讀原文

DistilQwen2

DistilQwen2是基于Qwen2大模型用知識(shí)蒸餾技術(shù)優(yōu)化得到的輕量級(jí)語(yǔ)言模型,能提高運(yùn)算效率和降低部署成本。DistilQwen2基于深度剖析大模型、增強(qiáng)指令數(shù)據(jù)多樣性...
閱讀原文

Hunyuan3D-1.0

Hunyuan3D-1.0 是騰訊推出的一款3D生成模型,具備文本和圖像輸入條件,支持高質(zhì)量的3D資產(chǎn)生成。該模型采用兩階段方法,首先使用多視角擴(kuò)散模型生成多視角RGB...
閱讀原文

Hunyuan-Large

Hunyuan-Large是騰訊推出的大型混合專家(MoE)模型,具有3890億總參數(shù)量和520億激活參數(shù)量,是目前業(yè)界參數(shù)規(guī)模最大的開源MoE模型。基于Transformer架構(gòu),支...
閱讀原文

Cofounder

Cofounder是開源的全棧AI開發(fā)代理,能幫助開發(fā)者基于單一提示自動(dòng)生成完整的應(yīng)用程序,包括后端、前端、數(shù)據(jù)庫(kù)和有狀態(tài)的Web應(yīng)用。Cofounder基于生成式AI技術(shù)...
閱讀原文

MagicTailor

MagicTailor 是專門為組件可控個(gè)性化設(shè)計(jì)的新框架,讓T2I模型在個(gè)性化過程中能夠精確控制。MagicTailor 基于兩個(gè)關(guān)鍵技術(shù)動(dòng)態(tài)掩碼退化(DM-Deg)和雙流平衡(...
閱讀原文

Claude Computer Use

Claude Computer Use是Anthropic公司為Claude 3.5 Sonnet和Claude 3.5 Haiku模型推出的新功能,支持AI模型Claude執(zhí)行類似人類的電腦操作,如查看屏幕、移動(dòng)光...
閱讀原文

Docling

Docling是開源的文檔解析和轉(zhuǎn)換工具,能高效地將多種格式的文檔(包括PDF、DOCX、PPTX、圖片和HTML)解析,導(dǎo)出為Markdown或JSON格式。Docling支持高級(jí)PDF理...
閱讀原文

Cerebellum

Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver構(gòu)建的瀏覽器AI智能助手,能理解任務(wù)意圖、執(zhí)行網(wǎng)頁(yè)自動(dòng)化任務(wù),如數(shù)據(jù)抓取和網(wǎng)站自動(dòng)化測(cè)試。Cerebe...
閱讀原文

WebRL

WebRL是清華大學(xué)、智譜AI聯(lián)合推出的自我進(jìn)化的在線課程強(qiáng)化學(xué)習(xí)框架,訓(xùn)練使用開放大型語(yǔ)言模型(LLMs)的高性能網(wǎng)絡(luò)代理。WebRL動(dòng)態(tài)生成任務(wù)、結(jié)果監(jiān)督獎(jiǎng)勵(lì)...
閱讀原文