標簽：圖像

深入解讀Transformer擴散模型的先驅之作：DiT、PixArt、HDiT

智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場；分會場將進行具身...

閱讀原文

AIGC動態

2年前 (2024)

微軟Copilot生成暴力圖且拒不更改，內部工程師絕望舉報至！

不久前，Gemini 因為圖像生成問題而關閉了文生圖功能，現在微軟也出現了“同樣”的問題。在微軟供職六年的微軟 AI 工程主管 Shane Jones 一直利用空閑時間測試...

閱讀原文

AIGC動態

2年前 (2024)

一文看盡297篇文獻！中科院領銜發表首篇「基于擴散模型的圖像編輯」綜述

新智元報道編輯：LRS 【新智元導讀】AIGC大模型最火熱的任務之一——基于Diffusion Model的圖像編輯（editing）領域的首篇綜述，長達26頁，涵蓋297篇文獻！本文...

閱讀原文

AIGC動態

2年前 (2024)

Midjourney封禁Stability AI：惡意爬取數據，致服務器癱瘓24小時

機器之心報道機器之心編輯部Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名單了，禁止后者所有員工使用其軟件，直至另行通知...

閱讀原文

AIGC動態

2年前 (2024)

中科院等萬字詳解：最前沿圖像擴散模型綜述

黃健成投稿量子位 | 公眾號 QbitAI針對圖像編輯中的擴散模型，中科院聯合Adobe和蘋果公司的研究人員發布了一篇重磅綜述。全文長達26頁，共1.5萬余詞，涵蓋2...

閱讀原文

AIGC動態

2年前 (2024)

Stable Diffusion 3技術報告出爐：揭露Sora同款架構細節

豐色發自凹非寺量子位 | 公眾號 QbitAI很快啊，“文生圖新王”Stable Diffusion 3的技術報告，這就來了。全文一共28頁，誠意滿滿。 “老規矩”，宣傳海報（??...

閱讀原文

AIGC動態

2年前 (2024)

Stable Diffusion 3技術報告流出，Sora構架再立大功！生圖圈開源暴打Midjourney和DALL·E 3？

新智元報道編輯：潤【新智元導讀】Stability AI放出了號稱能暴打閉源模型的Stable Diffusion 3的技術報告，采用DiT構架的新模型在靈活性和性能上都達到了新...

閱讀原文

AIGC動態

2年前 (2024)

Stable Diffusion 3 技術論文解讀：開源能贏得文生圖競賽嗎？｜甲子光年

文生圖模型的下一步是什么？作者｜趙健在大語言模型領域，閉源模型正在贏得比賽，無論是 OpenAI 還是剛剛發布新模型的 Anthropic，都是閉源模型的代表。但...

閱讀原文

AIGC動態

2年前 (2024)

Stable Diffusion 3論文終于發布，架構細節大揭秘，對復現Sora有幫助？

機器之心報道編輯：張倩在眾多前沿成果都不再透露技術細節之際，Stable Diffusion 3 論文的發布顯得相當珍貴。Stable Diffusion 3 的論文終于來了！這個模...

閱讀原文

AIGC動態

2年前 (2024)

最強文生圖模型架構曝光！28頁論文詳解技術細節，與Sora“師出同門”

消費級顯卡可訓，模型權重將開源。作者|香草編輯|李水青智東西3月6日報道，昨天下午，明星創企Stability AI發布Stable Diffusion 3（SD3）論文，首度披露...

閱讀原文

AIGC動態

2年前 (2024)

單圖0.5秒生成3D模型！Stability AI&華人團隊VAST出品

允中發自凹非寺量子位 | 公眾號 QbitAI無需GPU即可部署，0.5秒就能通過單張圖片生成3D模型。大語言模型風暴再起的一晚，3D生成領域也有新開源模型引發關注...

閱讀原文

AIGC動態

2年前 (2024)

0.5秒，無需GPU，Stability AI與華人團隊VAST開源單圖生成3D模型TripoSR

機器之心報道機器之心編輯部最近，文生視頻模型 Sora 掀起了新一輪生成式 AI 模型浪潮，模型的多模態能力引起廣泛關注。現在，AI 模型在 3D 內容生成方面又...

閱讀原文

AIGC動態

2年前 (2024)

揭秘美圖AI局部重繪技術

作者| 美圖影像研究院最近，靠著出其不意的擴圖效果，“AI 擴圖”功能憑借搞笑的補全結果頻頻出圈，火爆全網。網友們踴躍嘗試，180 度的大反轉也讓網友們直呼...

閱讀原文

AIGC動態

2年前 (2024)

谷歌發布最新「讀屏」AI！PaLM 2-S自動生成數據，多項理解任務刷新SOTA

新智元報道編輯：桃子【新智元導讀】谷歌在語言和聲控計算機界面的漫長道路上又邁出了重要一步。最新ScreenAI視覺語言模型，能夠完成各種屏幕QA問答、總結摘...

閱讀原文

AIGC動態

2年前 (2024)

2張圖2秒鐘3D重建！這款AI工具火爆GitHub，網友：忘掉Sora

豐色發自凹非寺量子位 | 公眾號 QbitAI只需2張圖片，無需測量任何額外數據—— 當當，一個完整的3D小熊就有了：這個名為DUSt3R的新工具，火得一塌糊涂，才上...

閱讀原文

AIGC動態

2年前 (2024)

1…24 252627 28…48