AI項(xiàng)目和框架
FLUX.1 Kontext
FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
Mobvoi MCP Server
Mobvoi MCP Server 是出門問問推出的一站式集成各項(xiàng) AI 能力的工具,Mobvoi MCP Server集成語音生成、聲音克隆、圖片驅(qū)動(dòng)數(shù)字人、視頻配音等多項(xiàng)多模態(tài) AI 能...
FLUX.1Kontext
FLUX.1 Kontext 是由 Black Forest Labs 推出的圖像生成與編輯模型,支持上下文感知的圖像處理。模型基于文本和圖像提示進(jìn)行生成與編輯,支持對象修改、風(fēng)格...
SearchAgent-X
SearchAgent-X 是南開大學(xué)和伊利諾伊大學(xué)厄巴納香檳分校(UIUC)研究人員推出的高效推理框架,能提升基于大型語言模型(LLM)的搜索Agent的效率。
MagicTryOn
MagicTryOn是浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院、vivo移動(dòng)通信等機(jī)構(gòu)推出的基于視頻擴(kuò)散Transformer的視頻虛擬試穿框架。框架替換傳統(tǒng)的U-Net架構(gòu)為更具表現(xiàn)力的...
Paper2Poster
Paper2Poster是加拿大滑鐵盧大學(xué)、新加坡國立大學(xué)等機(jī)構(gòu)推出的創(chuàng)新學(xué)術(shù)框架,基于多模態(tài)自動(dòng)化技術(shù)從科學(xué)論文生成海報(bào)。Paper2Poster推出PosterAgent,一個(gè)自...
OmniConsistency
OmniConsistency 是新加坡國立大學(xué)推出的圖像風(fēng)格遷移模型,能解決復(fù)雜場景下風(fēng)格化圖像的一致性問題。模型基于大規(guī)模配對的風(fēng)格化數(shù)據(jù)進(jìn)行訓(xùn)練,用兩階段訓(xùn)...
AI-Media2Doc
AI-Media2Doc 是開源的音視頻轉(zhuǎn)文檔工具,基于AI大模型技術(shù),支持將音視頻內(nèi)容智能轉(zhuǎn)換為小紅書筆記、公眾號文章、知識筆記、思維導(dǎo)圖和視頻字幕等多種文檔形...
DeepSeek-R1-0528
DeepSeek-R1-0528 是 DeepSeek 團(tuán)隊(duì)推出的最新版AI模型。模型基于 DeepSeek-V3-0324 訓(xùn)練,參數(shù)量達(dá) 660B。模型在 HuggingFace 上開源,開發(fā)者能自由使用和修...
粵公網(wǎng)安備 44011502001135號