標(biāo)簽:圖像

復(fù)旦等發(fā)布AnyGPT:任意模態(tài)輸入輸出,圖像、音樂、文本、語(yǔ)音都支持

機(jī)器之心報(bào)道 機(jī)器之心編輯部最近,OpenAI 的視頻生成模型 Sora 爆火,生成式 AI 模型在多模態(tài)方面的能力再次引起廣泛關(guān)注。 現(xiàn)實(shí)世界本質(zhì)上是多模態(tài)的,生物...
閱讀原文

ControlNet作者又出新作:百萬(wàn)數(shù)據(jù)訓(xùn)練,AI圖像生成迎來圖層設(shè)計(jì)

機(jī)器之心報(bào)道 編輯:陳萍、杜偉有人表示:「等待已久的 AI 圖像創(chuàng)建功能終于迎來了圖層!」盡管用于生成圖像的大模型已經(jīng)成為計(jì)算機(jī)視覺和圖形學(xué)的基礎(chǔ),但令...
閱讀原文

Stable Diffusion 解讀(一):回顧早期工作

智猩猩和智東西發(fā)起主辦的2024中國(guó)生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場(chǎng)將進(jìn)行開幕式、大模型專場(chǎng)、AI Infra專場(chǎng)和AIGC應(yīng)用專場(chǎng);分會(huì)場(chǎng)將進(jìn)行具身...
閱讀原文

ControlNet作者新作:AI繪畫能分圖層了!項(xiàng)目未開源就斬獲660 Star

金磊 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“絕不是簡(jiǎn)單的摳圖。” ControlNet作者最新推出的一項(xiàng)研究受到了一波高度關(guān)注—— 給一句prompt,用Stable Diffusion可...
閱讀原文

微軟37頁(yè)論文逆向工程Sora,得到了哪些結(jié)論?

機(jī)器之心報(bào)道 機(jī)器之心編輯部一篇論文回顧 Sora 文生視頻技術(shù)的背景、技術(shù)和應(yīng)用。 追趕 Sora,成為了很多科技公司當(dāng)下階段的新目標(biāo)。研究者們好奇的是:Sora...
閱讀原文

首批類Sora模型出現(xiàn),色拉布上線Snap Video,效果優(yōu)于Pika、不輸Gen-2

機(jī)器之心報(bào)道 編輯:杜偉、蛋醬文生視頻這個(gè)戰(zhàn)場(chǎng),入局的玩家越來越多了。這次是閱后即焚 SnapChat 背后的公司。 最近,OpenAI 視頻生成模型 Sora 的爆火,給...
閱讀原文

每周編輯精選|大模型有自己的 MBTI 數(shù)據(jù)集、成都理工大學(xué)搭建 SCDUNet++ 模型進(jìn)行滑坡測(cè)繪

滑坡是最常見的自然災(zāi)害之一,通常由地震和降雨引發(fā),由地震觸發(fā)的山體滑坡所造成的破壞,有時(shí)會(huì)比地震本身造成的破壞更為嚴(yán)重。為此,成都理工大學(xué)搭建了 SC...
閱讀原文

HiDream CTO 姚霆:Sora 出圈,中國(guó) AI 創(chuàng)業(yè)公司的機(jī)會(huì)在哪里?

Sora 的發(fā)布無(wú)疑是一個(gè)歷史性的里程碑,擴(kuò)散模型結(jié)合 Transformer,在視覺領(lǐng)域?qū)崿F(xiàn)了與大語(yǔ)言模型類似的突破。毫無(wú)疑問,視覺生成領(lǐng)域?qū)⒂幸淮未蟮募夹g(shù)和商業(yè)...
閱讀原文

縱覽機(jī)器學(xué)習(xí)前生今世,萬(wàn)字整理谷歌首席科學(xué)家 Jeff Dean 一小時(shí)演講

經(jīng)過算法的改進(jìn)和機(jī)器學(xué)習(xí)專用硬件的顯著提升,我們現(xiàn)在能夠構(gòu)建比以往任何時(shí)候都更為強(qiáng)大的通用機(jī)器學(xué)習(xí)系統(tǒng)。演講者| Jeff Dean 整理 |王啟隆 自從 2017 年...
閱讀原文

ICLR 2024 Spotlight|廈門大學(xué)、Intel、大疆聯(lián)合出品,從網(wǎng)絡(luò)視頻中學(xué)習(xí)零樣本圖像匹配大模型

機(jī)器之心專欄 機(jī)器之心編輯部圖像匹配是計(jì)算機(jī)視覺的一項(xiàng)基礎(chǔ)任務(wù),其目標(biāo)在于估計(jì)兩張圖像之間的像素對(duì)應(yīng)關(guān)系。圖像匹配是眾多視覺應(yīng)用如三維重建、視覺定位...
閱讀原文

Meta計(jì)劃7月推出Llama 3

點(diǎn)擊上方藍(lán)字關(guān)注我們據(jù)Information消息,Meta計(jì)劃于七月份推出其最新版本的人工智能大型語(yǔ)言模型Llama 3,旨在更好地應(yīng)對(duì)用戶提出的有爭(zhēng)議問題。 Meta的研究...
閱讀原文

蘇劍林:“閉門造車”之多模態(tài)模型方案淺談

智猩猩和智東西發(fā)起主辦的2024中國(guó)生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場(chǎng)將進(jìn)行開幕式、大模型專場(chǎng)、AI Infra專場(chǎng)和AIGC應(yīng)用專場(chǎng);分會(huì)場(chǎng)將進(jìn)行具身...
閱讀原文

剛剛,谷歌發(fā)布基礎(chǔ)世界模型:11B參數(shù),能生成可交互虛擬世界

機(jī)器之心報(bào)道 機(jī)器之心編輯部一鍵生成可玩游戲世界。 問世才兩個(gè)星期,谷歌的世界模型也來了,能力看起來更強(qiáng)大:它生成的虛擬世界「自主可控」。剛剛,谷歌...
閱讀原文

Sora完整能力曝光!多模態(tài)視頻理解或成為下次爆點(diǎn)

夕小瑤科技說 原創(chuàng)作者 | 王二狗大家好我是二狗。 就在今天,據(jù)推特大V“小互”分享,Sora的完整能力曝光,根據(jù)OpenAI 申請(qǐng)的SORA?商標(biāo)注冊(cè)描述顯示: 除了眾所...
閱讀原文

就是“快”!字節(jié)跳動(dòng)發(fā)布文生圖開放模型,迅速?zèng)_上Hugging Face Spaces 熱榜

作者 | 字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì) 很高興跟大家分享我們最新的文生圖模型 —— SDXL-Lightning,它實(shí)現(xiàn)了前所未有的速度和質(zhì)量,并且已經(jīng)向社區(qū)開放。 模型地址:ht...
閱讀原文
1252627282948