標(biāo)簽:圖像

深入解讀Transformer擴(kuò)散模型的先驅(qū)之作:DiT、PixArt、HDiT

智猩猩和智東西發(fā)起主辦的2024中國生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場將進(jìn)行開幕式、大模型專場、AI Infra專場和AIGC應(yīng)用專場;分會(huì)場將進(jìn)行具身...
閱讀原文

微軟Copilot生成暴力圖且拒不更改,內(nèi)部工程師絕望舉報(bào)至!

不久前,Gemini 因?yàn)閳D像生成問題而關(guān)閉了文生圖功能,現(xiàn)在微軟也出現(xiàn)了“同樣”的問題。 在微軟供職六年的微軟 AI 工程主管 Shane Jones 一直利用空閑時(shí)間測試...
閱讀原文

一文看盡297篇文獻(xiàn)!中科院領(lǐng)銜發(fā)表首篇「基于擴(kuò)散模型的圖像編輯」綜述

新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】AIGC大模型最火熱的任務(wù)之一——基于Diffusion Model的圖像編輯(editing)領(lǐng)域的首篇綜述,長達(dá)26頁,涵蓋297篇文獻(xiàn)!本文...
閱讀原文

Midjourney封禁Stability AI:惡意爬取數(shù)據(jù),致服務(wù)器癱瘓24小時(shí)

機(jī)器之心報(bào)道 機(jī)器之心編輯部Stability AI CEO Emad 表示他并不知情。Midjourney 把 Stability AI 拉入黑名單了,禁止后者所有員工使用其軟件,直至另行通知...
閱讀原文

中科院等萬字詳解:最前沿圖像擴(kuò)散模型綜述

黃健成 投稿量子位 | 公眾號 QbitAI針對圖像編輯中的擴(kuò)散模型,中科院聯(lián)合Adobe和蘋果公司的研究人員發(fā)布了一篇重磅綜述。 全文長達(dá)26頁,共1.5萬余詞,涵蓋2...
閱讀原文

Stable Diffusion 3技術(shù)報(bào)告出爐:揭露Sora同款架構(gòu)細(xì)節(jié)

豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI很快啊,“文生圖新王”Stable Diffusion 3的技術(shù)報(bào)告,這就來了。 全文一共28頁,誠意滿滿。 “老規(guī)矩”,宣傳海報(bào)(??...
閱讀原文

Stable Diffusion 3技術(shù)報(bào)告流出,Sora構(gòu)架再立大功!生圖圈開源暴打Midjourney和DALL·E 3?

新智元報(bào)道編輯:潤 【新智元導(dǎo)讀】Stability AI放出了號稱能暴打閉源模型的Stable Diffusion 3的技術(shù)報(bào)告,采用DiT構(gòu)架的新模型在靈活性和性能上都達(dá)到了新...
閱讀原文

Stable Diffusion 3 技術(shù)論文解讀:開源能贏得文生圖競賽嗎?|甲子光年

文生圖模型的下一步是什么?作者|趙健 在大語言模型領(lǐng)域,閉源模型正在贏得比賽,無論是 OpenAI 還是剛剛發(fā)布新模型的 Anthropic,都是閉源模型的代表。 但...
閱讀原文

Stable Diffusion 3論文終于發(fā)布,架構(gòu)細(xì)節(jié)大揭秘,對復(fù)現(xiàn)Sora有幫助?

機(jī)器之心報(bào)道 編輯:張倩在眾多前沿成果都不再透露技術(shù)細(xì)節(jié)之際,Stable Diffusion 3 論文的發(fā)布顯得相當(dāng)珍貴。Stable Diffusion 3 的論文終于來了! 這個(gè)模...
閱讀原文

最強(qiáng)文生圖模型架構(gòu)曝光!28頁論文詳解技術(shù)細(xì)節(jié),與Sora“師出同門”

消費(fèi)級顯卡可訓(xùn),模型權(quán)重將開源。 作者|香草 編輯|李水青 智東西3月6日報(bào)道,昨天下午,明星創(chuàng)企Stability AI發(fā)布Stable Diffusion 3(SD3)論文,首度披露...
閱讀原文

單圖0.5秒生成3D模型!Stability AI&華人團(tuán)隊(duì)VAST出品

允中 發(fā)自 凹非寺量子位 | 公眾號 QbitAI無需GPU即可部署,0.5秒就能通過單張圖片生成3D模型。 大語言模型風(fēng)暴再起的一晚,3D生成領(lǐng)域也有新開源模型引發(fā)關(guān)注...
閱讀原文

0.5秒,無需GPU,Stability AI與華人團(tuán)隊(duì)VAST開源單圖生成3D模型TripoSR

機(jī)器之心報(bào)道 機(jī)器之心編輯部最近,文生視頻模型 Sora 掀起了新一輪生成式 AI 模型浪潮,模型的多模態(tài)能力引起廣泛關(guān)注。 現(xiàn)在,AI 模型在 3D 內(nèi)容生成方面又...
閱讀原文

揭秘美圖AI局部重繪技術(shù)

作者| 美圖影像研究院 最近,靠著出其不意的擴(kuò)圖效果,“AI 擴(kuò)圖”功能憑借搞笑的補(bǔ)全結(jié)果頻頻出圈,火爆全網(wǎng)。網(wǎng)友們踴躍嘗試,180 度的大反轉(zhuǎn)也讓網(wǎng)友們直呼...
閱讀原文

谷歌發(fā)布最新「讀屏」AI!PaLM 2-S自動(dòng)生成數(shù)據(jù),多項(xiàng)理解任務(wù)刷新SOTA

新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】谷歌在語言和聲控計(jì)算機(jī)界面的漫長道路上又邁出了重要一步。最新ScreenAI視覺語言模型,能夠完成各種屏幕QA問答、總結(jié)摘...
閱讀原文

2張圖2秒鐘3D重建!這款A(yù)I工具火爆GitHub,網(wǎng)友:忘掉Sora

豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI只需2張圖片,無需測量任何額外數(shù)據(jù)—— 當(dāng)當(dāng),一個(gè)完整的3D小熊就有了: 這個(gè)名為DUSt3R的新工具,火得一塌糊涂,才上...
閱讀原文
1242526272848