AI項(xiàng)目和框架
AgentScope:阿里開(kāi)源多智能體開(kāi)發(fā)平臺(tái)實(shí)現(xiàn)高效協(xié)作與智能決策
AgentScope是阿里巴巴集團(tuán)開(kāi)源的多智能體開(kāi)發(fā)平臺(tái),幫助開(kāi)發(fā)者輕松構(gòu)建和部署多智能體應(yīng)用。AgentScope提供高易用性、高魯棒性和分布式支持,內(nèi)置多種模型API...
VisionFM:少樣本多疾病診斷的智能眼科AI模型
VisionFM(伏羲慧眼)是多模態(tài)多任務(wù)的視覺(jué)基礎(chǔ)模型,專(zhuān)為通用眼科人工智能而設(shè)計(jì)。通過(guò)預(yù)訓(xùn)練3.4百萬(wàn)張來(lái)自560,457個(gè)個(gè)體的眼科圖像,覆蓋廣泛的眼科疾病、...
Bamba-9B:Mamba2架構(gòu)驅(qū)動(dòng)的高效解碼語(yǔ)言模型展現(xiàn)卓越性能與靈活應(yīng)用
Bamba-9B是IBM、普林斯頓大學(xué)、卡內(nèi)基梅隆大學(xué)和伊利諾伊大學(xué)香檳分校聯(lián)合推出的,基于Mamba2架構(gòu)的僅解碼語(yǔ)言模型模型。模型在完全開(kāi)放的數(shù)據(jù)集上訓(xùn)練,能提...
HelloMeme:面部表情與姿態(tài)遷移技術(shù)驅(qū)動(dòng)的Stable Diffusion 1.5模型實(shí)現(xiàn)全新創(chuàng)作體驗(yàn)
HelloMeme是基于最新的Diffusion生成技術(shù)的框架,實(shí)現(xiàn)表情與姿態(tài)的遷移,HelloMeme集成空間編織注意力(Spatial Knitting Attentions)機(jī)制,基于Stable Diff...
ERA-42:星動(dòng)紀(jì)元全新端到端原生機(jī)器人大模型實(shí)現(xiàn)智能化交互與高效任務(wù)執(zhí)行
ERA-42是北京星動(dòng)紀(jì)元推出的端到端原生機(jī)器人大模型,與自研的五指靈巧手星動(dòng)XHAND1結(jié)合,能完成100多種復(fù)雜靈巧操作任務(wù)。ERA-42無(wú)需預(yù)編程,具備快速學(xué)習(xí)新...
Baichuan4-Finance:全鏈路金融領(lǐng)域智能增強(qiáng)大模型助力精準(zhǔn)決策與風(fēng)險(xiǎn)管理
Baichuan4-Finance是百川智能推出的全鏈路金融領(lǐng)域增強(qiáng)大模型,包括Baichuan4-Finance-Base和Baichuan4-Finance。基于Baichuan4-Turbo,用領(lǐng)域自約束訓(xùn)練,在...
3D-Speaker
3D-Speaker是阿里巴巴通義實(shí)驗(yàn)室語(yǔ)音團(tuán)隊(duì)推出的多模態(tài)開(kāi)源項(xiàng)目,基于結(jié)合聲學(xué)、語(yǔ)義、視覺(jué)信息,實(shí)現(xiàn)高精度的說(shuō)話(huà)人識(shí)別和語(yǔ)種識(shí)別。3D-Speaker提供工業(yè)級(jí)模...