標(biāo)簽:圖像

AI畫家的「滑鐵盧」:為什么冰可樂不愿意住進(jìn)茶杯里?

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收?qǐng)?bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級(jí)實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

阿里發(fā)“神筆馬良版Sora”,輕輕一抹讓貓咪轉(zhuǎn)向,20個(gè)演示視頻+10頁技術(shù)報(bào)告解讀

視頻生成告別“抽卡”。 作者|香草 編輯|李水青 AI視頻生成賽道風(fēng)起云涌,國內(nèi)外新穎的文生、圖生視頻產(chǎn)品層出不窮。在各大廠商的“內(nèi)卷”之下,當(dāng)下的視頻生成模...
閱讀原文

Stable Diffusion原班人馬官宣創(chuàng)業(yè),最強(qiáng)開源文生圖模型來了

今天,Stable Diffusion 原班人馬官宣創(chuàng)業(yè)新公司。創(chuàng)始人是3月宣布從 Stability AI 出走的 Robin Rombach,Stable Diffusion 的兩個(gè)主要作者之一。他和十多個(gè)...
閱讀原文

Stable Diffusion原班人馬新公司官宣!新模型一夜刷新AI繪畫格局,已獲2.3億元融資

衡宇 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI剛剛,Stable Diffusion原班人馬官宣創(chuàng)業(yè)新公司! 3月宣布從Stability AI出走的Robin Rombach,就是Stable Diffusion...
閱讀原文

全員離開老東家,Stable Diffusion一作帶團(tuán)創(chuàng)業(yè),出手即擊敗MJ v6、SD3,還開源

機(jī)器之心報(bào)道 編輯:杜偉、佳琪AI 圖像和視頻生成領(lǐng)域又加入了一個(gè)頗有實(shí)力的玩家。還記得今年 3 月底,從 AI 初創(chuàng)公司 Stability AI 離職的研究科學(xué)家 Robin...
閱讀原文

最強(qiáng)開源文生圖模型一夜易主!SD原班人馬打造,要發(fā)SOTA視頻生成模型

干翻SD3和MJ6!AI繪畫黑馬橫空出世。 作者|香草 編輯|李水青 最強(qiáng)開源文生圖模型一夜易主! 智東西8月2日?qǐng)?bào)道,昨日晚間,開源文生圖模型霸主Stable Diffusio...
閱讀原文

開放域檢測新SOTA!中山大學(xué)美團(tuán)出品,開源性能最強(qiáng)

王豪 投稿自 凹非寺量子位 | 公眾號(hào) QbitAI開放域檢測領(lǐng)域,迎來新進(jìn)展—— 中山大學(xué)聯(lián)合美團(tuán)提出新模型OV-DINO,實(shí)現(xiàn)開放域檢測開源新SOTA! 比Grounding DINO...
閱讀原文

對(duì)比學(xué)習(xí)濫用隱私數(shù)據(jù)!中科院等發(fā)布「多步誤差最小化」方法 | ACM MM2024

新智元報(bào)道編輯:LRST 好困 【新智元導(dǎo)讀】研究人員提出了一種新穎的多步誤差最小化(MEM)方法,用于生成多模態(tài)不可學(xué)習(xí)樣本,以保護(hù)個(gè)人數(shù)據(jù)不被多模態(tài)對(duì)比...
閱讀原文

Diffusion 反饋強(qiáng)勢助力 CLIP 秒變火眼金睛:北京智源研究院、中科院自動(dòng)化所聯(lián)合推出 DIVA

本文分享論文Diffusion Feedback Helps CLIP See Better,專注于通過自監(jiān)督學(xué)習(xí)范式解決CLIP無法區(qū)分細(xì)粒度視覺細(xì)節(jié)的問題。 作者:王文軒(中科院自動(dòng)化所-...
閱讀原文

教程上新 | 文生圖、圖生圖、圖像修復(fù)三合一神器, HiDiffusion 一鍵啟動(dòng)教程現(xiàn)已上線!

擴(kuò)散模型已成為高分辨率圖像合成的主流方法,傳統(tǒng)的擴(kuò)散模型雖然在圖像合成方面取得了顯著進(jìn)展,但在擴(kuò)展到更高分辨率時(shí)往往面臨對(duì)象重復(fù)和計(jì)算成本增加的問...
閱讀原文

國產(chǎn)多模態(tài)卷上下文長度:原生支持24K圖文輸入輸出,圖像視頻理解對(duì)標(biāo)GPT4V

陳林 投稿自 凹非寺量子位 | 公眾號(hào) QbitAI國產(chǎn)多模態(tài)大模型,也開始卷上下文長度。 書生·浦語靈筆(InternLM-XComposer)多模態(tài)大模型升級(jí)2.5版本—— 原生支...
閱讀原文

Midjourney新版本上線即爆火!網(wǎng)友已玩瘋:和攝影幾乎沒區(qū)別

明敏 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIMidjourney v6.1剛剛發(fā)布立刻爆火! 各種人像大片,一氣呵成。 畫面、光線、人物表情動(dòng)作……都更加逼近現(xiàn)實(shí)。 雕像的...
閱讀原文

AI 視頻生成器 Runway 推出新的圖像轉(zhuǎn)視頻功能

點(diǎn)擊上方藍(lán)字關(guān)注我們Runway 現(xiàn)在利用其最新的 Gen-3 Alpha 模型支持圖像轉(zhuǎn)視頻。用戶可以使用任何圖像作為創(chuàng)建視頻的起點(diǎn)。圖像可以單獨(dú)使用,也可以與文本...
閱讀原文

Meta「分割一切」進(jìn)化2.0!一鍵跟蹤物體,代碼權(quán)重?cái)?shù)據(jù)集全開源,網(wǎng)友:真正的OpenAI

明敏 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI又是發(fā)布即開源! Meta“分割一切AI”二代SAM2在SIGGRAPH上剛剛亮相。 相較于上一代,它的能力從圖像分割拓展到視頻分...
閱讀原文

防不勝防!AI幾米外隔空窺屏,HDMI線把信號(hào)泄露到空氣里了

一水 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI防不勝防!黑客通過顯示器數(shù)據(jù)線泄露的信號(hào),就能偷窺你的屏幕內(nèi)容。 具體來說,是HDMI數(shù)據(jù)線的電磁輻射,會(huì)把一些顯...
閱讀原文
18910111248