標簽:圖像

復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

機器之心報道 機器之心編輯部最近,OpenAI 的視頻生成模型 Sora 爆火,生成式 AI 模型在多模態方面的能力再次引起廣泛關注。 現實世界本質上是多模態的,生物...
閱讀原文

ControlNet作者又出新作:百萬數據訓練,AI圖像生成迎來圖層設計

機器之心報道 編輯:陳萍、杜偉有人表示:「等待已久的 AI 圖像創建功能終于迎來了圖層!」盡管用于生成圖像的大模型已經成為計算機視覺和圖形學的基礎,但令...
閱讀原文

Stable Diffusion 解讀(一):回顧早期工作

智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身...
閱讀原文

ControlNet作者新作:AI繪畫能分圖層了!項目未開源就斬獲660 Star

金磊 發自 凹非寺量子位 | 公眾號 QbitAI“絕不是簡單的摳圖。” ControlNet作者最新推出的一項研究受到了一波高度關注—— 給一句prompt,用Stable Diffusion可...
閱讀原文

微軟37頁論文逆向工程Sora,得到了哪些結論?

機器之心報道 機器之心編輯部一篇論文回顧 Sora 文生視頻技術的背景、技術和應用。 追趕 Sora,成為了很多科技公司當下階段的新目標。研究者們好奇的是:Sora...
閱讀原文

首批類Sora模型出現,色拉布上線Snap Video,效果優于Pika、不輸Gen-2

機器之心報道 編輯:杜偉、蛋醬文生視頻這個戰場,入局的玩家越來越多了。這次是閱后即焚 SnapChat 背后的公司。 最近,OpenAI 視頻生成模型 Sora 的爆火,給...
閱讀原文

每周編輯精選|大模型有自己的 MBTI 數據集、成都理工大學搭建 SCDUNet++ 模型進行滑坡測繪

滑坡是最常見的自然災害之一,通常由地震和降雨引發,由地震觸發的山體滑坡所造成的破壞,有時會比地震本身造成的破壞更為嚴重。為此,成都理工大學搭建了 SC...
閱讀原文

HiDream CTO 姚霆:Sora 出圈,中國 AI 創業公司的機會在哪里?

Sora 的發布無疑是一個歷史性的里程碑,擴散模型結合 Transformer,在視覺領域實現了與大語言模型類似的突破。毫無疑問,視覺生成領域將有一次大的技術和商業...
閱讀原文

縱覽機器學習前生今世,萬字整理谷歌首席科學家 Jeff Dean 一小時演講

經過算法的改進和機器學習專用硬件的顯著提升,我們現在能夠構建比以往任何時候都更為強大的通用機器學習系統。演講者| Jeff Dean 整理 |王啟隆 自從 2017 年...
閱讀原文

ICLR 2024 Spotlight|廈門大學、Intel、大疆聯合出品,從網絡視頻中學習零樣本圖像匹配大模型

機器之心專欄 機器之心編輯部圖像匹配是計算機視覺的一項基礎任務,其目標在于估計兩張圖像之間的像素對應關系。圖像匹配是眾多視覺應用如三維重建、視覺定位...
閱讀原文

Meta計劃7月推出Llama 3

點擊上方藍字關注我們據Information消息,Meta計劃于七月份推出其最新版本的人工智能大型語言模型Llama 3,旨在更好地應對用戶提出的有爭議問題。 Meta的研究...
閱讀原文

蘇劍林:“閉門造車”之多模態模型方案淺談

智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI Infra專場和AIGC應用專場;分會場將進行具身...
閱讀原文

剛剛,谷歌發布基礎世界模型:11B參數,能生成可交互虛擬世界

機器之心報道 機器之心編輯部一鍵生成可玩游戲世界。 問世才兩個星期,谷歌的世界模型也來了,能力看起來更強大:它生成的虛擬世界「自主可控」。剛剛,谷歌...
閱讀原文

Sora完整能力曝光!多模態視頻理解或成為下次爆點

夕小瑤科技說 原創作者 | 王二狗大家好我是二狗。 就在今天,據推特大V“小互”分享,Sora的完整能力曝光,根據OpenAI 申請的SORA?商標注冊描述顯示: 除了眾所...
閱讀原文

就是“快”!字節跳動發布文生圖開放模型,迅速沖上Hugging Face Spaces 熱榜

作者 | 字節跳動智能創作團隊 很高興跟大家分享我們最新的文生圖模型 —— SDXL-Lightning,它實現了前所未有的速度和質量,并且已經向社區開放。 模型地址:ht...
閱讀原文
1252627282948