AI項(xiàng)目和框架

Seer

Seer是由上海AI實(shí)驗(yàn)室、北京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院、北京大學(xué)軟件與微電子學(xué)院等機(jī)構(gòu)聯(lián)合推出的端到端操作模型,實(shí)現(xiàn)機(jī)器人視覺預(yù)測(cè)與動(dòng)作執(zhí)行的高度協(xié)同...
閱讀原文

ArtCrafter

ArtCrafter是清華大學(xué)、鵬城實(shí)驗(yàn)室和聯(lián)想研究院共同推出的文本到圖像風(fēng)格遷移框架,基于擴(kuò)散模型,解決傳統(tǒng)方法在風(fēng)格表達(dá)、內(nèi)容一致性和輸出多樣性方面的局...
閱讀原文

Ingredients

Ingredients是強(qiáng)大的框架,基于將多個(gè)特定身份(ID)照片與視頻擴(kuò)散Transformer相結(jié)合,用在定制視頻創(chuàng)作。Ingredients基于三個(gè)核心模塊實(shí)現(xiàn)高度定制化的視頻...
閱讀原文

MultiBooth

MultiBooth是清華大學(xué)深圳國(guó)際研究生院、 Meta、香港科技大學(xué)等機(jī)構(gòu)推出的多概念圖像生成方法,能從文本中生成包含多個(gè)用戶指定概念的圖像。MultiBooth將生成...
閱讀原文

Aria-UI

Aria-UI是香港大學(xué)和Rhymes AI共同推出的為圖形用戶界面(GUI)定位任務(wù)設(shè)計(jì)的大型多模態(tài)模型。基于純視覺方法,不依賴于HTML或AXTree等輔助輸入,用大規(guī)模、...
閱讀原文

TransPixar

TransPixar是香港中文大學(xué)、Adobe研究院 、香港科技大學(xué)和智能摩爾聯(lián)合開源的,先進(jìn)的文本到視頻生成方法,擴(kuò)展預(yù)訓(xùn)練的RGB視頻模型生成包含透明度信息的RGBA...
閱讀原文

星火人設(shè)

星火人設(shè)是科大訊飛推出的專為情感交互而設(shè)計(jì)的獨(dú)立模型(角色模擬API),具備人物設(shè)定、劇情演繹與語言風(fēng)格等控制選項(xiàng),支持模型精調(diào)。在規(guī)模C端用戶的雙盲...
閱讀原文

萬相2.1

萬相2.1是阿里推出的通義萬相升級(jí)版本。基于自研的高效VAE和DiT架構(gòu),增強(qiáng)時(shí)空上下文建模能力,支持無限長(zhǎng)1080P視頻的高效編解碼,首次實(shí)現(xiàn)中文文字視頻生成...
閱讀原文

星火紀(jì)要

星火紀(jì)要是科大訊飛推出的集轉(zhuǎn)錄、總結(jié)、翻譯、分析為一體的音視頻處理平臺(tái),廣泛應(yīng)用于通用會(huì)議、訪談、銷售、培訓(xùn)等場(chǎng)景。能幫助個(gè)人高效總結(jié)會(huì)議重點(diǎn)內(nèi)容...
閱讀原文

AutoDroid-V2

AutoDroid-V2是清華大學(xué)人工智能產(chǎn)業(yè)研究院推出的基于小型語言模型(SLM)的移動(dòng)端GUI自動(dòng)化腳本代理,能基于代碼生成技術(shù)提升設(shè)備上的GUI代理性能。AutoDroi...
閱讀原文

EnerVerse

EnerVerse 是智元機(jī)器人團(tuán)隊(duì)開發(fā)的首個(gè)機(jī)器人4D世界模型,旨在通過生成未來具身空間來指導(dǎo)機(jī)器人完成復(fù)雜任務(wù)。模型采用自回歸擴(kuò)散模型,結(jié)合稀疏記憶機(jī)制(S...
閱讀原文

PsycoLLM

PsycoLLM是合肥工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院推出的中文心理大型語言模型,基于高質(zhì)量的心理數(shù)據(jù)集訓(xùn)練,提升對(duì)心理健康問題的理解和評(píng)估能力。模型的數(shù)...
閱讀原文

Casevo

Casevo(Cognitive Agents and Social Evolution Simulator)是中國(guó)傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體傳播學(xué)院、中國(guó)傳媒大學(xué)媒體融合與傳播國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合推出...
閱讀原文

NMT

NMT(No More Tuning)是UC Berkeley和阿里巴巴集團(tuán)聯(lián)合推出的多任務(wù)學(xué)習(xí)框架,能解決多任務(wù)學(xué)習(xí)中不同任務(wù)優(yōu)先級(jí)優(yōu)化的問題。NMT將多任務(wù)學(xué)習(xí)問題轉(zhuǎn)化為約束...
閱讀原文

MiniPerplx

MiniPerplx 是開源的 AI 搜索引擎,基于 Grok 2.0 模型進(jìn)行搜索。MiniPerplx提供了免費(fèi)的替代方案,用在搜索網(wǎng)頁(yè)、推特帖子、研究論文和 YouTube 視頻等內(nèi)容...
閱讀原文
18283848586155