AI項(xiàng)目和框架

AgentScope:阿里開(kāi)源多智能體開(kāi)發(fā)平臺(tái)實(shí)現(xiàn)高效協(xié)作與智能決策

AgentScope是阿里巴巴集團(tuán)開(kāi)源的多智能體開(kāi)發(fā)平臺(tái),幫助開(kāi)發(fā)者輕松構(gòu)建和部署多智能體應(yīng)用。AgentScope提供高易用性、高魯棒性和分布式支持,內(nèi)置多種模型API...
閱讀原文

VisionFM:少樣本多疾病診斷的智能眼科AI模型

VisionFM(伏羲慧眼)是多模態(tài)多任務(wù)的視覺(jué)基礎(chǔ)模型,專(zhuān)為通用眼科人工智能而設(shè)計(jì)。通過(guò)預(yù)訓(xùn)練3.4百萬(wàn)張來(lái)自560,457個(gè)個(gè)體的眼科圖像,覆蓋廣泛的眼科疾病、...
閱讀原文

InvSR

InvSR是創(chuàng)新的圖像超分辨率模型,基于擴(kuò)散模型的逆過(guò)程恢復(fù)高分辨率圖像。用大型預(yù)訓(xùn)練擴(kuò)散模型中豐富的圖像先驗(yàn),改善超分辨率的效果。InvSR的核心在于深度...
閱讀原文

DisPose

DisPose是北京大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、清華大學(xué)和香港科技大學(xué)的研究團(tuán)隊(duì)共同推出的,提高人物圖像動(dòng)畫(huà)質(zhì)量的控制技術(shù),基于從骨骼姿態(tài)和參考圖像中提取有效...
閱讀原文

MetaMorph

MetaMorph是多模態(tài)大模型(MLLM),通過(guò)指令微調(diào)(Instruction Tuning)實(shí)現(xiàn)視覺(jué)理解和生成。它提出了一種名為Visual-Predictive Instruction Tuning(VPiT)...
閱讀原文

Bamba-9B:Mamba2架構(gòu)驅(qū)動(dòng)的高效解碼語(yǔ)言模型展現(xiàn)卓越性能與靈活應(yīng)用

Bamba-9B是IBM、普林斯頓大學(xué)、卡內(nèi)基梅隆大學(xué)和伊利諾伊大學(xué)香檳分校聯(lián)合推出的,基于Mamba2架構(gòu)的僅解碼語(yǔ)言模型模型。模型在完全開(kāi)放的數(shù)據(jù)集上訓(xùn)練,能提...
閱讀原文

HelloMeme:面部表情與姿態(tài)遷移技術(shù)驅(qū)動(dòng)的Stable Diffusion 1.5模型實(shí)現(xiàn)全新創(chuàng)作體驗(yàn)

HelloMeme是基于最新的Diffusion生成技術(shù)的框架,實(shí)現(xiàn)表情與姿態(tài)的遷移,HelloMeme集成空間編織注意力(Spatial Knitting Attentions)機(jī)制,基于Stable Diff...
閱讀原文

ERA-42:星動(dòng)紀(jì)元全新端到端原生機(jī)器人大模型實(shí)現(xiàn)智能化交互與高效任務(wù)執(zhí)行

ERA-42是北京星動(dòng)紀(jì)元推出的端到端原生機(jī)器人大模型,與自研的五指靈巧手星動(dòng)XHAND1結(jié)合,能完成100多種復(fù)雜靈巧操作任務(wù)。ERA-42無(wú)需預(yù)編程,具備快速學(xué)習(xí)新...
閱讀原文

Baichuan4-Finance:全鏈路金融領(lǐng)域智能增強(qiáng)大模型助力精準(zhǔn)決策與風(fēng)險(xiǎn)管理

Baichuan4-Finance是百川智能推出的全鏈路金融領(lǐng)域增強(qiáng)大模型,包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo,用領(lǐng)域自約束訓(xùn)練,在...
閱讀原文

VSI-Bench

VSI-Bench(Visual-Spatial Intelligence Benchmark)是李飛飛、謝賽寧及他們的研究團(tuán)隊(duì)推出的視覺(jué)空間智能基準(zhǔn)測(cè)試集,研究者構(gòu)建用在評(píng)估多模態(tài)大型語(yǔ)言模...
閱讀原文

Bamba-9B

Bamba-9B是IBM、普林斯頓大學(xué)、卡內(nèi)基梅隆大學(xué)和伊利諾伊大學(xué)香檳分校聯(lián)合推出的,基于Mamba2架構(gòu)的僅解碼語(yǔ)言模型模型。模型在完全開(kāi)放的數(shù)據(jù)集上訓(xùn)練,能提...
閱讀原文

Univer

Univer是開(kāi)源的全棧框架,支持創(chuàng)建和編輯電子表格、文檔及幻燈片,為用戶(hù)提供統(tǒng)一且強(qiáng)大的辦公解決方案。Univer能在瀏覽器和Node.js環(huán)境中運(yùn)行,易于集成到各...
閱讀原文

Kheish

Kheish是開(kāi)源的、基于大型語(yǔ)言模型(LLM)的多智能體編排平臺(tái),用多個(gè)專(zhuān)門(mén)的角色(智能體)和靈活的工作流協(xié)調(diào)復(fù)雜任務(wù)的各個(gè)步驟,如提案生成、審核、驗(yàn)證和...
閱讀原文

3D-Speaker

3D-Speaker是阿里巴巴通義實(shí)驗(yàn)室語(yǔ)音團(tuán)隊(duì)推出的多模態(tài)開(kāi)源項(xiàng)目,基于結(jié)合聲學(xué)、語(yǔ)義、視覺(jué)信息,實(shí)現(xiàn)高精度的說(shuō)話(huà)人識(shí)別和語(yǔ)種識(shí)別。3D-Speaker提供工業(yè)級(jí)模...
閱讀原文

ERA-42

ERA-42是北京星動(dòng)紀(jì)元推出的端到端原生機(jī)器人大模型,與自研的五指靈巧手星動(dòng)XHAND1結(jié)合,能完成100多種復(fù)雜靈巧操作任務(wù)。ERA-42無(wú)需預(yù)編程,具備快速學(xué)習(xí)新...
閱讀原文
18283848586146