標簽:圖像生成

SignGemma

SignGemma 是谷歌 DeepMind 團隊推出的全球最強大的手語翻譯AI模型。專注于將美國手語(ASL)翻譯成英語文本,通過多模態訓練方法,結合視覺數據和文本數據,...
閱讀原文

MiMo-VL

MiMo-VL 是小米開源的多模態大模型,由視覺編碼器、跨模態投影層和語言模型構成,視覺編碼器基于Qwen2.5-ViT,語言模型是小米自研的MiMo-7B。
閱讀原文

Gemini Diffusion

Gemini Diffusion是谷歌推出的實驗性文本擴散模型。與傳統自回歸模型逐詞生成文本不同,基于逐步細化噪聲生成輸出,能快速迭代糾正錯誤,讓Gemini Diffusion...
閱讀原文

Imagen 4

Imagen 4是谷歌發布的最新圖像生成AI模型。支持高達2K分辨率的圖像生成,細節呈現逼真,可清晰呈現復雜織物紋理、水滴折射及動物毛發質感等。在文本渲染方面...
閱讀原文

BLIP3-o

BLIP3-o是Salesforce Research等機構推出的創新多模態模型,融合自回歸模型的推理和指令遵循能力及擴散模型的強大生成能力。模型基于擴散語義豐富的CLIP圖像...
閱讀原文

混元圖像2.0

混元圖像2.0(Hunyuan Image 2.0)是騰訊推出的業內首個毫秒級響應的實時生圖大模型?;煸獔D像2.0支持文本、語音、草圖等多種交互方式,用戶輸入指令后,圖像...
閱讀原文

Pablo

Pablo是幫助用戶快速創建品牌化網頁的AI工具,用戶只需上傳SVG、PNG或JPG格式的Logo,Pablo能基于Logo的風格和元素,快速生成與品牌高度契合的網站設計。
閱讀原文

Image-AI.pro

Image-AI.pro 是專業級的 AI 圖像生成平臺,基于強大的 img-v2 Pro 引擎驅動,能生成高質量、多風格的圖像作品。具備高級語義理解能力,能精準捕捉用戶的創作...
閱讀原文

Pixelfox

Pixelfox 是免費的在線圖片編輯工具,基于AI技術簡化圖片編輯過程。Pixelfox 提供多種功能,如背景移除、對象移除、圖片增強、AI 修復、換臉、圖片擴展和圖像...
閱讀原文

T2I-R1

T2I-R1 是香港中文大學和上海AI Lab聯合推出的新型文本生成圖像模型?;谝腚p層推理機制,語義級鏈式思維(CoT)和 Token 級 CoT,實現高層次圖像規劃與低...
閱讀原文

Firefly Image Model 4

Firefly Image Model 4 是 Adobe 最新推出的圖像生成模型,是目前最快、最具控制性和最逼真的 Firefly 圖像模型,支持生成逼真的圖像,提供更高的分辨率(最...
閱讀原文

GPT-image-1

GPT-image-1是OpenAI推出的原生多模態圖像生成模型,基于API向開發者開放使用。模型根據文本提示和圖像生成高質量、專業級的圖像,支持多種風格和自定義功能...
閱讀原文

PixelFlow

PixelFlow 是香港大學和Adobe聯合推出的圖像生成模型,支持直接在像素空間中生成圖像。PixelFlow基于高效的級聯流建模,從低分辨率逐步提升到高分辨率,顯著...
閱讀原文

Creati

Creati是AI照片生成應用。Creati基于先進AI技術,將普通照片轉化為高質量、專業級圖像。支持用戶輕松去除背景、更換背景、調整服裝和發型,將照片生成不同職...
閱讀原文

Midjourney V7

Midjourney V7 是 Midjourney 推出的最新版 AI 圖像生成模型,在圖像生成質量、交互模式和創作效率等方面進行了多項重大改進。草稿模式(Draft Mode)能將圖...
閱讀原文
12345611