標簽:圖像生成

Mini DALL·E 3

Mini DALL·E 3 是北京理工大學、上海AI Lab、清華大學和香港中文大學聯合推出的交互式文本到圖像(iT2I)框架。基于自然語言與用戶進行多輪對話,實現高質量...
閱讀原文

LanPaint

LanPaint 是?為Stable Diffusion 模型設計的高質量圖像修復工具,無需額外訓練實現精準的圖像修復和替換。LanPaint基于多輪迭代推理優化修復效果,支持無縫且...
閱讀原文

VideoPainter

VideoPainter 是香港中文大學、騰訊ARC Lab、東京大學、澳門大學等機構推出的視頻修復和編輯框架,專門用在處理任意長度的視頻內容。VideoPainter基于雙分支...
閱讀原文

Fractal Generative Models

Fractal Generative Models(分形生成模型)是麻省理工學院計算機科學與人工智能實驗室和Google DeepMind團隊推出的新型圖像生成方法。Fractal Generative Mo...
閱讀原文

CogView4

CogView4 是智譜推出的開源文生圖模型,具有60億參數,支持原生中文輸入和中文文字生成。模型在 DPG-Bench 基準測試中綜合評分排名第一,達到開源文生圖模型...
閱讀原文

LCVD

LCVD(Lighting Controllable Video Diffusion Model)是四川大學推出的高保真、光照可控的肖像動畫生成框架。LCVD基于分離肖像的內在特征(如身份和外觀)與...
閱讀原文

Bild AI

Bild AI 是專注于建筑行業的智能工具,基于人工智能技術讀取和理解建筑藍圖,快速估算材料成本確保藍圖準確性。通過計算機視覺和自然語言處理技術,自動解析...
閱讀原文

廈門大學《大模型概念、技術與應用實踐》(PPT文件)

《大模型概念、技術與應用實踐》由廈門大學大數據教學團隊制作,科普大模型技術及其在各領域的應用。強調其在大數據教學領域的影響力。回顧人工智能發展簡史...
閱讀原文

圖像生成迎來CoT時刻!港中文首次提出文生圖的o1推理和inference scaling新范式!

首次系統性地探討了CoT在自回歸圖像生成中的適用性和潛在優勢。
閱讀原文

CogView-3-Flash

CogView-3-Flash 是智譜推出的首個免費AI圖像生成模型,能根據文本描述生成高審美分數的圖像,支持多種分辨率,滿足專業領域需求。模型具備創意多樣性,基于...
閱讀原文

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模態圖片理解模型,模型完善了 moonshot-v1 模型系列的多模態能力,具備強大的圖像識別能力,能精準區分復雜...
閱讀原文

EverArt

EverArt - AI繪畫平臺,支持訓練自己的AI模型
閱讀原文

TransPixar

TransPixar是香港中文大學、Adobe研究院 、香港科技大學和智能摩爾聯合開源的,先進的文本到視頻生成方法,擴展預訓練的RGB視頻模型生成包含透明度信息的RGBA...
閱讀原文

何愷明團隊新作Fluid:文生圖質量刷新紀錄

本文對自回歸模型在文本生成圖像任務中的擴展行為進行了實證研究。
閱讀原文
13456711