標簽:圖像

我在淘天做算法:十年拍立淘,一部視覺算法技術演變史

編者按:提到“程序猿”,大家腦海中是不是立刻浮現出格子衫、不修邊幅、呆滯的畫面形象?這些刻板印象已經out啦,其實程序員們都是敬業又聰明的熱血少年!他們...
閱讀原文

下載次數破39萬!CMU、Meta聯合發布VQAScore文生圖優化方案:Imagen3已采用

新智元報道編輯:LRST 【新智元導讀】VQAScore是一個利用視覺問答模型來評估由文本提示生成的圖像質量的新方法;GenAI-Bench是一個包含復雜文本提示的基準測...
閱讀原文

清華大學最新!2萬字長文全面解讀多模態生成式AI的前世今生!

點擊下方卡片,關注“AI生成未來”后臺回復“GAI”,免費獲取最新AI相關行業報告和資料! 作者:Hong Chen等 解讀:AI生成未來 文章鏈接:https://arxiv.org/pdf/...
閱讀原文

o1圖像理解神秘現身,網友瘋狂測試!Altman自曝:o2研究生級水平破105%

新智元報道編輯:桃子 【新智元導讀】完整版o1圖像理解能力,被提前「放出」了?網友曝出o1能夠識圖,進行推理總結。現在,o1多模態一大波試用已經鋪屏全網。...
閱讀原文

幻覺不一定有害,新框架用AI的「幻覺」優化圖像分割技術

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

多圖場景用DPO對齊!上海AI實驗室等提出新方法,無需人工標注

劉子煜 投稿量子位 | 公眾號 QbitAI多圖像場景也能用DPO方法來對齊了! 由上海交大、上海AI實驗室、港中文等帶來最新成果MIA-DPO。 這是一個面向大型視覺語言...
閱讀原文

神秘模型“小熊貓”一夜刷屏!登上生圖排行榜第一

夕小瑤科技說 分享來源 | 機器之心大家別猜了,「red_panda」(小熊貓)模型有主了。 謎底解開了。 前幾天在 Hugging Face 文本轉圖像排行榜上排名第一的 red...
閱讀原文

登上生圖排行榜第一的red_panda,是家創業公司,不是國產模型

機器之心報道 機器之心編輯部大家別猜了,「red_panda」(小熊貓)模型有主了。謎底解開了。 前幾天在 Hugging Face 文本轉圖像排行榜上排名第一的 red_panda...
閱讀原文

在線教程 | 重回霸主地位,Stable Diffusion 3.5 輕松生成多元化風格圖像

HyperAI超神經教程版塊現已上線「Stable-Diffusion-3.5-Large 圖像生成 Demo」,無需輸入任何命令,一鍵克隆即可快速體驗!今年 6 月,Stability AI 隆重發布...
閱讀原文

統一圖像生成,無需繁雜插件!智源發布擴散模型框架OmniGen

允中 發自 凹非寺量子位 | 公眾號 QbitAI多模態模型,統一圖像生成。 最新擴散模型框架來了。 智源研究院推出OmniGen,它能天然支持各種圖像生成任務,架構高...
閱讀原文

多模態大模型: 盤點&Highlights part2——Qwen-VL系列

講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀Hi大家好,我叫延捷,...
閱讀原文

NeurIPS 2024收錄!基于擴散模型編碼器模塊的推理加速丨一作、南開大學博士生李森茂講座預告

最近,文本到圖像的擴散模型取得了顯著的進步。值得注意的是,Stable Diffusion和DeepFloyd-IF是當前開源社區中最成功的兩個擴散模型。這些模型基于UNet架構...
閱讀原文

神秘模型“小熊貓”一夜刷屏:排名超Flux、Midjourney,網友:一看就中國的

一水 發自 凹非寺量子位 | 公眾號 QbitAI一夜之間,名為“red_panda”(小熊貓)的神秘文生圖模型狠狠火了!! 登頂文生圖競技場,直接將Flux、Midjourney等一...
閱讀原文

新擴散模型OmniGen一統圖像生成,架構還高度簡化、易用

機器之心發布 機器之心編輯部大型語言模型(LLM)的出現統一了語言生成任務,并徹底改變了人機交互。然而,在圖像生成領域,能夠在單一框架內處理各種任務的...
閱讀原文

一個模型走天下!智源提出全新擴散架構OmniGen,AI生圖進入「一鍵生成」時代

新智元報道編輯:編輯部 HYZ 【新智元導讀】LLM統一了語言生成任務,圖像生成可以嗎?就在剛剛,智源推出了全新擴散模型架構OmniGen,單個模型就能生成圖像,...
閱讀原文
123448