AI項(xiàng)目和框架

FLUX.1 Kontext

FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
閱讀原文

EVI 3

EVI 3是Hume AI推出的全新語音語言模型,模型能同時(shí)處理文本和語音標(biāo)記,實(shí)現(xiàn)自然、富有表現(xiàn)力的語音交互。模型支持高度個(gè)性化,根據(jù)用戶提示生成任何聲音和...
閱讀原文

OmniSync

OmniSync是中國人民大學(xué)、快手科技和清華大學(xué)聯(lián)合推出的通用對口型框架,基于擴(kuò)散變換器(Diffusion Transformers)實(shí)現(xiàn)視頻中人物口型與語音的精準(zhǔn)同步。Omn...
閱讀原文

Mobvoi MCP Server

Mobvoi MCP Server 是出門問問推出的一站式集成各項(xiàng) AI 能力的工具,Mobvoi MCP Server集成語音生成、聲音克隆、圖片驅(qū)動(dòng)數(shù)字人、視頻配音等多項(xiàng)多模態(tài) AI 能...
閱讀原文

FLUX.1Kontext

FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
閱讀原文

SearchAgent-X

SearchAgent-X 是南開大學(xué)和伊利諾伊大學(xué)厄巴納香檳分校(UIUC)研究人員推出的高效推理框架,能提升基于大型語言模型(LLM)的搜索Agent的效率。
閱讀原文

WebAgent

WebAgent是阿里巴巴開源的自主搜索AI Agent,具備端到端的自主信息檢索與多步推理能力。WebAgent能像人類一樣在網(wǎng)絡(luò)環(huán)境中主動(dòng)感知、決策和行動(dòng),應(yīng)用在學(xué)術(shù)...
閱讀原文

MagicTryOn

MagicTryOn是浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院、vivo移動(dòng)通信等機(jī)構(gòu)推出的基于視頻擴(kuò)散Transformer的視頻虛擬試穿框架。框架替換傳統(tǒng)的U-Net架構(gòu)為更具表現(xiàn)力的...
閱讀原文

可靈2.1

可靈2.1是快手推出的AI視頻生成模型,模型現(xiàn)已上線可靈AI視頻平臺。平臺更新包含可靈2.1和可靈2.1大師版兩大基礎(chǔ)模型。模型在速度、效果和價(jià)格上都有顯著提升...
閱讀原文

Paper2Poster

Paper2Poster是加拿大滑鐵盧大學(xué)、新加坡國立大學(xué)等機(jī)構(gòu)推出的創(chuàng)新學(xué)術(shù)框架,基于多模態(tài)自動(dòng)化技術(shù)從科學(xué)論文生成海報(bào)。Paper2Poster推出PosterAgent,一個(gè)自...
閱讀原文

OmniConsistency

OmniConsistency 是新加坡國立大學(xué)推出的圖像風(fēng)格遷移模型,能解決復(fù)雜場景下風(fēng)格化圖像的一致性問題。模型基于大規(guī)模配對的風(fēng)格化數(shù)據(jù)進(jìn)行訓(xùn)練,用兩階段訓(xùn)...
閱讀原文

AI-Media2Doc

AI-Media2Doc 是開源的音視頻轉(zhuǎn)文檔工具,基于AI大模型技術(shù),支持將音視頻內(nèi)容智能轉(zhuǎn)換為小紅書筆記、公眾號文章、知識筆記、思維導(dǎo)圖和視頻字幕等多種文檔形...
閱讀原文

DeepSeek-R1-0528

DeepSeek-R1-0528 是 DeepSeek 團(tuán)隊(duì)推出的最新版AI模型。模型基于 DeepSeek-V3-0324 訓(xùn)練,參數(shù)量達(dá) 660B。模型在 HuggingFace 上開源,開發(fā)者能自由使用和修...
閱讀原文

CoGenAV

CoGenAV - 通義聯(lián)合深圳技術(shù)大學(xué)推出的多模態(tài)語音表征模型
閱讀原文

Onit

Onit是為Mac設(shè)計(jì)的AI聊天助手,支持停靠在任何應(yīng)用程序中。Onit支持高亮文本自動(dòng)加載,用戶只需選擇文本,Onit能自動(dòng)作為上下文打開,無需復(fù)制粘貼。
閱讀原文
13334353637155