為 Diffusion Transformer 提供高效靈活的控制框架。
實(shí)現(xiàn)靈活且高保真度的圖像生成,同時(shí)保持身份特征。
生成高質(zhì)量 SVG 代碼的基礎(chǔ)模型。
免費(fèi) AI 創(chuàng)作工具,生成圖像、視頻及 4K 增強(qiáng)。
WHAM 是微軟開發(fā)的一種生成式游戲模型,用于生成游戲視覺和控制器動(dòng)作。
用于衡量設(shè)備 AI 加速器推理性能的基準(zhǔn)測(cè)試工具。
朱雀大模型檢測(cè),精準(zhǔn)識(shí)別AI生成圖像,助力內(nèi)容真實(shí)性鑒別。
FLUX Pro Finetuning API 是一款用于定制化生成式圖像模型的高級(jí)工具。
X-Dyna是一種基于擴(kuò)散模型的零樣本人類圖像動(dòng)畫生成技術(shù)。
VideoLLaMA3是前沿的多模態(tài)基礎(chǔ)模型,專注于圖像和視頻理解。
TokenVerse 是一種基于預(yù)訓(xùn)練文本到圖像擴(kuò)散模型的多概念個(gè)性化方法。
一種新穎的圖像到視頻采樣技術(shù),基于Hunyuan模型實(shí)現(xiàn)高質(zhì)量視頻生成。
Janus-Pro-1B 是一個(gè)統(tǒng)一多模態(tài)理解和生成的自回歸框架。
Genime AI 是一款專注于動(dòng)畫生成與編輯的工具,提供圖像到 3D、補(bǔ)間動(dòng)畫等功能。
Qwen2.5-VL 是一款強(qiáng)大的視覺語言模型,能夠理解圖像和視頻內(nèi)容并生成相應(yīng)文本。
一個(gè)基于語音交互的故事創(chuàng)作聊天機(jī)器人,提供沉浸式的“選擇你自己的冒險(xiǎn)”體驗(yàn)。
Janus Pro 是一款先進(jìn)的 AI 圖像生成與理解平臺(tái),提供高質(zhì)量的視覺智能服務(wù)。
OmniParser 是一款通用屏幕解析工具,可將 UI 截圖轉(zhuǎn)換為結(jié)構(gòu)化格式,提升基于 LLM 的 UI 代理性能。
VisionAgent是一個(gè)用于生成代碼以解決視覺任務(wù)的庫,支持多種LLM提供商。
SigLIP2 是谷歌推出的一種多語言視覺語言編碼器,用于零樣本圖像分類。
Adobe 推出全新 Photoshop iPhone 應(yīng)用,為移動(dòng)創(chuàng)作者重新定義圖像編輯體驗(yàn)。
UniTok是一個(gè)用于視覺生成和理解的統(tǒng)一視覺分詞器。
微軟Copilot是您的AI助手,支持聊天、圖像生成、文本編輯等功能,助力日常工作和生活。
Aya Vision 32B 是一個(gè)支持多語言的視覺語言模型,適用于OCR、圖像描述、視覺推理等多種用途。
由 Google 訓(xùn)練的 AI 模型,用于對(duì)野生動(dòng)物相機(jī)陷阱圖像中的物種進(jìn)行分類。
HunyuanVideo-I2V 是騰訊推出的基于 HunyuanVideo 的圖像到視頻生成框架。
使用先進(jìn) AI 技術(shù)快速去除圖片背景,無需手動(dòng)編輯,提升工作效率。
即時(shí)匹配任何圖像中的顏色
Inductive Moment Matching 是一種新型的生成模型,用于高質(zhì)量圖像生成。
一種無混疊的任意尺度超分辨率方法。
一個(gè)由moondream創(chuàng)建的Hugging Face Space,用于展示注視點(diǎn)相關(guān)技術(shù)
下一代AI創(chuàng)意工作室,支持視頻和圖像生成及編輯。
OpenI AI助手在線工具硅基流動(dòng)豆包Trae扣子Coze即夢(mèng)繪蛙