標簽:風格遷移

EVI 3

EVI 3是Hume AI推出的全新語音語言模型,模型能同時處理文本和語音標記,實現自然、富有表現力的語音交互。模型支持高度個性化,根據用戶提示生成任何聲音和...
閱讀原文

Image-AI.pro

Image-AI.pro 是專業級的 AI 圖像生成平臺,基于強大的 img-v2 Pro 引擎驅動,能生成高質量、多風格的圖像作品。具備高級語義理解能力,能精準捕捉用戶的創作...
閱讀原文

D-DiT

D-DiT(Dual Diffusion Transformer)是卡內基梅隆大學、耶魯大學和字節跳動Seed實驗室推出的多模態擴散模型,能統一圖像生成和理解任務。模型結合連續圖像擴...
閱讀原文

救救圖片

救救圖片是基于AI技術的在線圖片處理工具,能快速去除圖片水印、修復模糊、無損放大、去除馬賽克,支持一鍵摳圖和生成相似圖片等功能。基于先進的AI算法,可...
閱讀原文

DiffSplat

DiffSplat是新型的 3D 生成方法,從文本提示和單視圖圖像快速生成 3D 高斯點陣(Gaussian Splats)。通過微調預訓練的文本到圖像擴散模型,基于強大的 2D 先...
閱讀原文

AI Dev Gallery

AI Dev Gallery是微軟推出的開源AI工具包和示例庫,集成在Visual Studio中,幫助Windows開發者輕松集成端側AI功能。AI Dev Gallery提供超過25個交互式示例,...
閱讀原文

什么是生成對抗網絡(GANs):智能家居助手提升生活便利性與安全性

生成對抗網絡(GANs)是一種深度學習模型,由生成器和判別器兩部分組成,通過互相博弈學習達到數據生成的目的。生成器的任務是從隨機噪聲中生成數據,而判別...
閱讀原文

什么是圖像生成(Image generation)

圖像生成(Image generation)是計算機視覺領域的一項重要研究方向,通過深度學習模型,如VAE、GANs和Diffusion Model等,從數據中學習并生成新的圖像。這項...
閱讀原文

TensorPix:智能圖像視頻質量提升與壓縮解決方案

TensorPix是在線AI視頻和圖像質量增強平臺,基于先進的AI技術,提供視頻放大至4K分辨率、圖像增強和放大、在線視頻壓縮等功能。用戶直接在瀏覽器中操作,無需...
閱讀原文

ComfyUI-Bxb

ComfyUI-Bxb是“SD變現寶”,一鍵把 ComfyUI 工作流轉換成小程序,專為小程序開發者設計,實現快速變現。ComfyUI-Bxb的核心功能是將ComfyUI工作流轉換為微信小...
閱讀原文

ImageFX

Google ImageFX是谷歌最新推出的一款人工智能圖像生成工具,基于谷歌的 DeepMind 實驗室開發的一個先進的文本到圖像的生成模型 — Imagen 2。ImageFX 的設計目...
閱讀原文

DiffusionGPT

DiffusionGPT是由來自字節跳動與中山大學的研究人員推出的一個開源的大模型(LLM)驅動的文本到圖像生成系統,旨在解決文生圖領域無法處理不同的輸入或者僅限...
閱讀原文

AnimateDiff

AnimateDiff是由上海人工智能實驗室、香港中文大學和斯坦福大學的研究人員推出的一款將個性化的文本到圖像模型擴展為動畫生成器的框架,其核心在于它能夠利用...
閱讀原文

DiT

DiT(Diffusion Transformers)是一種新型的擴散模型,由William Peebles(Sora的研發負責人之一) 與紐約大學助理教授謝賽寧提出,結合了去噪擴散概率模型(...
閱讀原文

Stable Diffusion 3

Stable Diffusion 3 是由 Stability AI 開發的一款先進的文本到圖像生成模型,是 Stable Diffusion 系列模型的最新迭代,旨在通過文本提示生成高質量的圖像。...
閱讀原文
123