標(biāo)簽:圖像
我在淘天做算法:十年拍立淘,一部視覺算法技術(shù)演變史
編者按:提到“程序猿”,大家腦海中是不是立刻浮現(xiàn)出格子衫、不修邊幅、呆滯的畫面形象?這些刻板印象已經(jīng)out啦,其實(shí)程序員們都是敬業(yè)又聰明的熱血少年!他們...
下載次數(shù)破39萬(wàn)!CMU、Meta聯(lián)合發(fā)布VQAScore文生圖優(yōu)化方案:Imagen3已采用
新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】VQAScore是一個(gè)利用視覺問(wèn)答模型來(lái)評(píng)估由文本提示生成的圖像質(zhì)量的新方法;GenAI-Bench是一個(gè)包含復(fù)雜文本提示的基準(zhǔn)測(cè)...
清華大學(xué)最新!2萬(wàn)字長(zhǎng)文全面解讀多模態(tài)生成式AI的前世今生!
點(diǎn)擊下方卡片,關(guān)注“AI生成未來(lái)”后臺(tái)回復(fù)“GAI”,免費(fèi)獲取最新AI相關(guān)行業(yè)報(bào)告和資料! 作者:Hong Chen等 解讀:AI生成未來(lái) 文章鏈接:https://arxiv.org/pdf/...
o1圖像理解神秘現(xiàn)身,網(wǎng)友瘋狂測(cè)試!Altman自曝:o2研究生級(jí)水平破105%
新智元報(bào)道編輯:桃子 【新智元導(dǎo)讀】完整版o1圖像理解能力,被提前「放出」了?網(wǎng)友曝出o1能夠識(shí)圖,進(jìn)行推理總結(jié)。現(xiàn)在,o1多模態(tài)一大波試用已經(jīng)鋪屏全網(wǎng)。...
幻覺不一定有害,新框架用AI的「幻覺」優(yōu)化圖像分割技術(shù)
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過(guò)去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
多圖場(chǎng)景用DPO對(duì)齊!上海AI實(shí)驗(yàn)室等提出新方法,無(wú)需人工標(biāo)注
劉子煜 投稿量子位 | 公眾號(hào) QbitAI多圖像場(chǎng)景也能用DPO方法來(lái)對(duì)齊了! 由上海交大、上海AI實(shí)驗(yàn)室、港中文等帶來(lái)最新成果MIA-DPO。 這是一個(gè)面向大型視覺語(yǔ)言...
神秘模型“小熊貓”一夜刷屏!登上生圖排行榜第一
夕小瑤科技說(shuō) 分享來(lái)源 | 機(jī)器之心大家別猜了,「red_panda」(小熊貓)模型有主了。 謎底解開了。 前幾天在 Hugging Face 文本轉(zhuǎn)圖像排行榜上排名第一的 red...
登上生圖排行榜第一的red_panda,是家創(chuàng)業(yè)公司,不是國(guó)產(chǎn)模型
機(jī)器之心報(bào)道 機(jī)器之心編輯部大家別猜了,「red_panda」(小熊貓)模型有主了。謎底解開了。 前幾天在 Hugging Face 文本轉(zhuǎn)圖像排行榜上排名第一的 red_panda...
在線教程 | 重回霸主地位,Stable Diffusion 3.5 輕松生成多元化風(fēng)格圖像
HyperAI超神經(jīng)教程版塊現(xiàn)已上線「Stable-Diffusion-3.5-Large 圖像生成 Demo」,無(wú)需輸入任何命令,一鍵克隆即可快速體驗(yàn)!今年 6 月,Stability AI 隆重發(fā)布...
統(tǒng)一圖像生成,無(wú)需繁雜插件!智源發(fā)布擴(kuò)散模型框架OmniGen
允中 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI多模態(tài)模型,統(tǒng)一圖像生成。 最新擴(kuò)散模型框架來(lái)了。 智源研究院推出OmniGen,它能天然支持各種圖像生成任務(wù),架構(gòu)高...
多模態(tài)大模型: 盤點(diǎn)&Highlights part2——Qwen-VL系列
講座預(yù)告11月1日上午10點(diǎn),南開大學(xué)在讀博士李森茂,將以《基于擴(kuò)散模型編碼器模塊的推理加速》為主題進(jìn)行直播講解,歡迎掃碼報(bào)名~導(dǎo)讀Hi大家好,我叫延捷,...
NeurIPS 2024收錄!基于擴(kuò)散模型編碼器模塊的推理加速丨一作、南開大學(xué)博士生李森茂講座預(yù)告
最近,文本到圖像的擴(kuò)散模型取得了顯著的進(jìn)步。值得注意的是,Stable Diffusion和DeepFloyd-IF是當(dāng)前開源社區(qū)中最成功的兩個(gè)擴(kuò)散模型。這些模型基于UNet架構(gòu)...
神秘模型“小熊貓”一夜刷屏:排名超F(xiàn)lux、Midjourney,網(wǎng)友:一看就中國(guó)的
一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI一夜之間,名為“red_panda”(小熊貓)的神秘文生圖模型狠狠火了!! 登頂文生圖競(jìng)技場(chǎng),直接將Flux、Midjourney等一...
新擴(kuò)散模型OmniGen一統(tǒng)圖像生成,架構(gòu)還高度簡(jiǎn)化、易用
機(jī)器之心發(fā)布 機(jī)器之心編輯部大型語(yǔ)言模型(LLM)的出現(xiàn)統(tǒng)一了語(yǔ)言生成任務(wù),并徹底改變了人機(jī)交互。然而,在圖像生成領(lǐng)域,能夠在單一框架內(nèi)處理各種任務(wù)的...
一個(gè)模型走天下!智源提出全新擴(kuò)散架構(gòu)OmniGen,AI生圖進(jìn)入「一鍵生成」時(shí)代
新智元報(bào)道編輯:編輯部 HYZ 【新智元導(dǎo)讀】LLM統(tǒng)一了語(yǔ)言生成任務(wù),圖像生成可以嗎?就在剛剛,智源推出了全新擴(kuò)散模型架構(gòu)OmniGen,單個(gè)模型就能生成圖像,...