AI項(xiàng)目和框架

R2R

R2R是先進(jìn)的AI檢索系統(tǒng)，專注于Retrieval-Augmented Generation（增強(qiáng)型檢索生成）。R2R集成多模態(tài)內(nèi)容攝取、混合搜索、知識(shí)圖譜構(gòu)建、GraphRAG聚類分析、用...

閱讀原文

AI工具

11個(gè)月前

PanoDreamer

PanoDreamer是能夠從單張圖像生成連貫的360° 3D場(chǎng)景的新方法。這種方法不同于現(xiàn)有技術(shù)，它將問題構(gòu)建為單圖像全景和深度估計(jì)的兩個(gè)優(yōu)化任務(wù)，并引入交替最小...

閱讀原文

AI工具

11個(gè)月前

TANGOFLUX

TANGOFLUX是高效的文本到音頻生成模型，是新加坡科技設(shè)計(jì)大學(xué)（SUTD）和NVIDIA共同推出的。模型擁有約5.15億參數(shù)，能在單個(gè)A40 GPU上僅用3.7秒生成長(zhǎng)達(dá)30秒的...

閱讀原文

AI工具

11個(gè)月前

MMedAgent

MMedAgent是專為醫(yī)療領(lǐng)域設(shè)計(jì)的多模態(tài)AI智能體，通過整合各種開源醫(yī)療模型來管理多種醫(yī)療任務(wù)。系統(tǒng)包括一個(gè)指令調(diào)整的多模態(tài)大型語言模型（MLLM），作為行動(dòng)...

閱讀原文

AI工具

11個(gè)月前

VITRON

VITRON是Skywork AI、新加坡國(guó)立大學(xué)和南洋理工大學(xué)聯(lián)合推出的像素級(jí)視覺大型語言模型（LLM），能全面理解和處理靜態(tài)圖像與動(dòng)態(tài)視頻，對(duì)圖像和視頻進(jìn)行理解、...

閱讀原文

AI工具

11個(gè)月前

n8n

n8n是開源的自動(dòng)化工作流管理系統(tǒng)，提供一個(gè)低代碼平臺(tái)，支持用戶用拖放的方式創(chuàng)建復(fù)雜的工作流，無需編寫代碼。n8n支持400多個(gè)應(yīng)用程序和服務(wù)的集成，包括AI...

閱讀原文

AI工具

11個(gè)月前

SoulChat2.0

SoulChat2.0是華南理工大學(xué)未來技術(shù)學(xué)院-廣東省數(shù)字孿生人重點(diǎn)實(shí)驗(yàn)室基于SoulChat1.0模型推出的心理咨詢師數(shù)字孿生大語言模型。首次定義了特定心理咨詢師的數(shù)...

閱讀原文

AI工具

11個(gè)月前

SAC-KG

SAC-KG是基于大型語言模型（LLMs）自動(dòng)構(gòu)建領(lǐng)域知識(shí)圖譜的通用框架。由生成器、驗(yàn)證器和剪枝器三個(gè)主要組件構(gòu)成，能自動(dòng)從原始領(lǐng)域語料庫中生成特定領(lǐng)域的一...

閱讀原文

AI工具

11個(gè)月前

TryOffAnyone

TryOffAnyone是能將穿著服裝的人物照片轉(zhuǎn)換成平鋪的服裝展示圖的AI工具。基于先進(jìn)的Latent Diffusion Models技術(shù)，自動(dòng)識(shí)別并提取照片中的服裝區(qū)域，然后將其...

閱讀原文

AI工具

11個(gè)月前

ILLUME

ILLUME是華為諾亞方舟實(shí)驗(yàn)室提出的統(tǒng)一多模態(tài)大模型，將視覺理解與生成能力融入同一框架中。模型以大型語言模型（LLM）為核心，采用“連續(xù)圖像輸入 + 離散圖像...

閱讀原文

AI工具

11個(gè)月前

AigcPanel

AigcPanel是開源AI數(shù)字人系統(tǒng)，以簡(jiǎn)潔易用著稱，支持視頻合成、聲音合成和聲音克隆等核心功能。系統(tǒng)基于TypeScript開發(fā)，跨平臺(tái)兼容，遵循AGPL-3.0協(xié)議，便于...

閱讀原文

AI工具

11個(gè)月前

HuatuoGPT-o1

HuatuoGPT-o1是香港中文大學(xué)（深圳）和深圳大數(shù)據(jù)研究院聯(lián)合推出的，針對(duì)醫(yī)學(xué)領(lǐng)域開發(fā)的復(fù)雜推理模型，基于復(fù)雜的推理能力提高解決醫(yī)學(xué)問題的性能。模型用兩...

閱讀原文

AI工具

11個(gè)月前

Wonderland

Wonderland是多倫多大學(xué)、Snap和UCLA的研究團(tuán)隊(duì)推出的技術(shù)，能夠從單張圖像生成高質(zhì)量、廣范圍的3D場(chǎng)景，允許控制攝像軌跡。證明了三維重建模型可以有效地建...

閱讀原文

AI工具

11個(gè)月前

VersaGen

VersaGen是文本到圖像合成的生成式AI代理，能實(shí)現(xiàn)靈活的視覺控制能力。VersaGen能處理包括單一視覺主體、多個(gè)視覺主體、場(chǎng)景背景，這些元素的任意組合在內(nèi)的...

閱讀原文

AI工具

11個(gè)月前

AutoRAG

AutoRAG是中國(guó)科學(xué)院計(jì)算技術(shù)研究所（ICT/CAS）、中國(guó)科學(xué)院的人工智能安全重點(diǎn)實(shí)驗(yàn)室及中國(guó)科學(xué)院大學(xué)的研究人員共同推出的新型自主迭代檢索模型，專為大型...

閱讀原文

AI工具

11個(gè)月前

1…86 878889 90…155