為 Diffusion Transformer 提供高效靈活的控制框架。
通過去噪生成模型進行空間推理,解決復雜分布下的視覺任務。
Inductive Moment Matching 是一種新型的生成模型,用于高質量圖像生成。
一種新的文本條件高分辨率生成模型
視頻到音頻生成模型,增強同步性
StemGen: 一款聆聽音樂生成模型
盲圖像恢復技術,利用即時生成參考圖像恢復破損圖像
SVD 1.1 Image-to-Video 模型生成短視頻
生成多視角視頻的模型
基于文本生成圖像的多模態擴散變換器模型
長文本問答增強型檢索生成模型
PixelCNN++是一種基于PixelCNN的生成模型,具有可計算的似然函數和易于采樣的特點,適用于圖像生成和數據增強等應用場景。,PixelCNN官網入口網址
Musenet (OpenAI)是一個基于深度神經網絡的生成模型,可生成長度為4分鐘,包含10種不同樂器和多種風格的音樂作品。該模型使用了類似于GPT-2的無監督學習方法,通過學習預測數十萬...
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙