標(biāo)簽:圖像
Stable Diffusion 3.5最強(qiáng)模型全家桶來了,三個(gè)型號(hào)
就在剛剛,Stability AI發(fā)布了自家最強(qiáng)的模型Stable Diffusion 3.5,而且是一個(gè)全家桶,包含三個(gè)版本。 鏈接:https://huggingface.co/stabilityai Stable Di...
DeepSeek新作Janus:解耦視覺編碼,引領(lǐng)多模態(tài)理解與生成統(tǒng)一新范式
AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
入選ECCV 2024!浙江大合微軟亞洲研究院提出統(tǒng)一醫(yī)學(xué)圖像預(yù)訓(xùn)練框架UniMedI,打破醫(yī)學(xué)數(shù)據(jù)異構(gòu)化藩籬
作者:哇塞 編輯:十九,李寶珠 浙江大學(xué)聯(lián)合微軟亞洲研究院提出了一種全新的統(tǒng)一醫(yī)學(xué)圖像預(yù)訓(xùn)練框架 UniMedI。它利用診斷報(bào)告作為公共語義空間,可為不同模...
ECCV 2024收錄!曠視提出無需訓(xùn)練的更高分辨率圖像生成框架HiDiffusion | 一作、高級(jí)研究員張慎主講預(yù)告
在圖像生成領(lǐng)域,高分辨率圖像的生成一直是一個(gè)具有挑戰(zhàn)性的工作。Stable Diffusion等強(qiáng)大的預(yù)訓(xùn)練擴(kuò)散模型目前可以生成1024x1024像素的高質(zhì)量圖像。但生成更...
AI 已經(jīng)醫(yī)學(xué)影像及癌癥檢測(cè)中超越人類專家
隨著人工智能(AI)技術(shù)的迅速發(fā)展,醫(yī)療行業(yè)正經(jīng)歷一場(chǎng)深刻的變革。最新的研究成果顯示,AI不僅在疾病的檢測(cè)和診斷中展現(xiàn)出了超乎想象的潛力,還在一些領(lǐng)域...
搞定圖像+文本+視頻大一統(tǒng)!智源發(fā)布多模態(tài)世界模型Emu3:下一個(gè)token預(yù)測(cè)直通AGI
下一個(gè)token預(yù)測(cè),通向多模態(tài)AGI。 OpenAI前首席科學(xué)家、聯(lián)合創(chuàng)始人Ilya Sutskever曾在多個(gè)場(chǎng)合表達(dá)觀點(diǎn):只要能夠非常好的預(yù)測(cè)下一個(gè)token,就能幫助人類達(dá)...
智源 Emu3 證明多模態(tài)模型新范式:只需基于下一個(gè) token 預(yù)測(cè)
只需基于下一個(gè) token 預(yù)測(cè),智源 Emu3 重新定義多模態(tài)模型。OpenAI前首席科學(xué)家、聯(lián)合創(chuàng)始人Ilya Sutskever曾在多個(gè)場(chǎng)合表達(dá)觀點(diǎn):只要能夠非常好的預(yù)測(cè)下一...
Ilya預(yù)言成真,下一個(gè)token預(yù)測(cè)直達(dá)AGI!智源首發(fā)原生多模態(tài)世界模型Emu3,不用擴(kuò)散
新智元報(bào)道編輯:編輯部 HYZ 【新智元導(dǎo)讀】最近,Ilya向黃仁勛描述「只要能預(yù)測(cè)下一個(gè)token,就能達(dá)到AGI」的視頻再次爆火全網(wǎng),他的預(yù)言剛剛竟被證實(shí)?智源...
Ilya觀點(diǎn)得證!僅靠預(yù)測(cè)下一個(gè)token統(tǒng)一圖像文本視頻,智源發(fā)布原生多模態(tài)世界模型Emu3
夢(mèng)晨 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIOpenAI前首席科學(xué)家、聯(lián)合創(chuàng)始人Ilya Sutskever曾在多個(gè)場(chǎng)合表達(dá)觀點(diǎn): 只要能夠非常好的預(yù)測(cè)下一個(gè)token,就能幫助...
視頻、圖像、文本,只需基于下一個(gè)Token預(yù)測(cè):智源Emu3發(fā)布,驗(yàn)證多模態(tài)模型新范式
機(jī)器之心發(fā)布 機(jī)器之心編輯部OpenAI 前首席科學(xué)家、聯(lián)合創(chuàng)始人 Ilya Sutskever 曾在多個(gè)場(chǎng)合表達(dá)觀點(diǎn):只要能夠非常好的預(yù)測(cè)下一個(gè) token,就能幫助人類達(dá)到...
OCR-Omni來了,字節(jié)&華師統(tǒng)一多模態(tài)文字理解與生成 | NeurIPS2024
TextHarmony團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI多模態(tài)生成新突破,字節(jié)&華師團(tuán)隊(duì)打造TextHarmony,在單一模型架構(gòu)中實(shí)現(xiàn)模態(tài)生成的統(tǒng)一,并入選NeurIPS 202...
比Flux更強(qiáng)大的文生圖模型來了!秘訣是“集百家之長”
IterComp團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI打造更強(qiáng)大文生圖模型新思路有—— 面對(duì)Flux、stable diffusion、Omost等爆火模型,有人開始主打“集各家所長”。 具體...
4090筆記本0.37秒直出大片!英偉達(dá)聯(lián)手MIT清華祭出Sana架構(gòu),速度秒殺FLUX
新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】一臺(tái)4090筆記本,秒生1K質(zhì)量高清圖。英偉達(dá)聯(lián)合MIT清華團(tuán)隊(duì)提出的Sana架構(gòu),得益于核心架構(gòu)創(chuàng)新,具備了驚人的圖像...
性能不輸SOTA,計(jì)算量僅DiT一半!T2X任務(wù)新范式來了 | 中山大學(xué)&360 AI Research
Qihoo-T2X團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI性能不輸SOTA模型,計(jì)算開銷卻更低了—— 中山大學(xué)和360 AI Research聯(lián)合推出PT-DiT,同參數(shù)規(guī)模下,計(jì)算量僅為DiT的...
學(xué)生最偉大的新研究!書里的斜坡實(shí)驗(yàn)、透鏡變化規(guī)律用AI都動(dòng)起來了
夕小瑤科技說 分享來源 | 機(jī)器之心原來物理還能這么學(xué)。 學(xué)習(xí)物理,不同的人自然有不同的經(jīng)歷。一些人覺得物理課簡單直觀,但另一些人卻認(rèn)為它抽象又反直覺,...