標簽:圖像

高通萬衛星:終端側生成式AI時代已經來臨|中國AIGC產業峰會

編輯部 整理自 AIGC峰會量子位 | 公眾號 QbitAIAI手機、AI PC硬件新物種正嶄露頭角。 高通作為技術及芯片廠商,所提供的產品和解決方案正在推動AIGC相關產業...
閱讀原文

輕松拿捏4K高清圖像理解!這個多模態大模型自動分析網頁海報內容,打工人簡直不要太方便

陳林 投稿自 凹非寺量子位 | 公眾號 QbitAI一個可以自動分析PDF、網頁、海報、Excel圖表內容的大模型,對于打工人來說簡直不要太方便。 上海AI Lab,香港中文...
閱讀原文

「個性化」圖像生成時代來了!六大頂尖高校聯手發布全新Gen4Gen框架

新智元報道編輯:LRS 【新智元導讀】文中提出了一個半自動數據集創建管道Gen4Gen,將個性化概念與文本描述結合成復雜的組合,創建了基準測試數據集MyCanvas,...
閱讀原文

生成擴散模型漫談:信噪比與大圖生成

導讀本文作者為蘇劍林,來自月之暗面。這篇文章介紹了 Simple Diffusion,這是一篇探索如何直接在 Pixel 空間中端到端地訓練圖像擴散模型的工作,利用了信噪...
閱讀原文

CVPR 2024高分論文:全新生成式編輯框架GenN2N,統一NeRF轉換任務

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

MLLM真能看懂數學嗎?MathVerse來了次摸底測評,放出當天登熱榜

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

每周編輯精選|老鄉雞開源「菜品溯源報告」、修復老照片 SUPIR 工具在線使用

號外!號外!老鄉雞的「機密文件」竟然被公開了! 近日,老鄉雞將 20 萬字的《老鄉雞菜品溯源報告》向社會全面公開,從食材的源頭到烹飪的細節,全都清清楚楚...
閱讀原文

Stable Diffusion 3 API 發布!超越Midjourney v6和DALL-E 3

夕小瑤科技說 原創作者 | 任同學Stable Diffusion 3 于 2 月首次宣布作為預覽版發布。而今天,StabilityAI 正式推出了 Stable Diffusion 3 和 Stable Diffusi...
閱讀原文

CVPR 2024|文本或圖像提示精準編輯 3D 場景,美圖&信工所&北航&中大聯合提出 3D 編輯方法 CustomNeRF

作者 | 美圖影像研究院 美圖影像研究院(MT Lab)與中國科學院信息工程研究所、北京航空航天大學、中山大學共同提出了 3D 場景編輯方法——CustomNeRF,同時支...
閱讀原文

梗圖理解“天花板”!港中文終身教授賈佳亞團隊推出多模態模型:GPT-4+DALL-E 3,王炸組合刷爆榜單

整理 | 傅宇琪 近日,港中文終身教授賈佳亞團隊推出了一款名為 Mini-Gemini 的多模態模型,包括 2B 小杯到 34B 的超大杯,一經發布便登上了 PaperWithCode 熱...
閱讀原文

在線教程|低門檻部署!SUPIR 專治各種圖片模糊,還能理解文本描述進行精修

作者:十九 編輯:李寶珠,三羊 封面圖來源:SUPIR官網 SUPIR 圖像修復工具可應用于模糊風景、人物、動物、游戲畫面的修復等。家庭相冊中泛黃的老照片,歷史...
閱讀原文

融合ChatGPT+DALL·E 3,賈佳亞團隊新作開源暢玩:識圖推理生圖一站解決

允中 發自 凹非寺量子位 | 公眾號 QbitAI在開源社區中把GPT-4+Dall·E 3能?整合起來的模型該有多強? 香港中文大學終身教授賈佳亞團隊提出多模態模型Mini-Gem...
閱讀原文

北大字節開辟圖像生成新范式!超越Sora核心組件DiT,不再預測下一個token

魚羊 發自 凹非寺量子位 | 公眾號 QbitAI北大和字節聯手搞了個大的: 提出圖像生成新范式,從預測下一個token變成預測下一級分辨率,效果超越Sora核心組件Dif...
閱讀原文

今日arXiv最熱NLP大模型論文:北京大學&快手發布統一的圖文視頻生成大模型Video-LaVIT

夕小瑤科技說 原創作者 | 芒果引言:探索視頻與語言模型的新融合隨著多模態大語言模型(LLMs)的新發展,人們越來越關注如何將它們從圖像-文本數據擴展到更具...
閱讀原文

賈佳亞團隊新模型對標ChatGPT+DALL-E 3王炸組合!讀懂梗圖刷爆榜單,代碼復現數學函數

新智元報道編輯:編輯部 【新智元導讀】賈佳亞團隊提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸組合,一上線就刷爆了多模態任務榜單!讀得懂梗圖,做得了...
閱讀原文
1192021222348