標簽:圖像
AI畫家的「滑鐵盧」:為什么冰可樂不愿意住進茶杯里?
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
阿里發“神筆馬良版Sora”,輕輕一抹讓貓咪轉向,20個演示視頻+10頁技術報告解讀
視頻生成告別“抽卡”。 作者|香草 編輯|李水青 AI視頻生成賽道風起云涌,國內外新穎的文生、圖生視頻產品層出不窮。在各大廠商的“內卷”之下,當下的視頻生成模...
Stable Diffusion原班人馬官宣創業,最強開源文生圖模型來了
今天,Stable Diffusion 原班人馬官宣創業新公司。創始人是3月宣布從 Stability AI 出走的 Robin Rombach,Stable Diffusion 的兩個主要作者之一。他和十多個...
Stable Diffusion原班人馬新公司官宣!新模型一夜刷新AI繪畫格局,已獲2.3億元融資
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI剛剛,Stable Diffusion原班人馬官宣創業新公司! 3月宣布從Stability AI出走的Robin Rombach,就是Stable Diffusion...
全員離開老東家,Stable Diffusion一作帶團創業,出手即擊敗MJ v6、SD3,還開源
機器之心報道 編輯:杜偉、佳琪AI 圖像和視頻生成領域又加入了一個頗有實力的玩家。還記得今年 3 月底,從 AI 初創公司 Stability AI 離職的研究科學家 Robin...
最強開源文生圖模型一夜易主!SD原班人馬打造,要發SOTA視頻生成模型
干翻SD3和MJ6!AI繪畫黑馬橫空出世。 作者|香草 編輯|李水青 最強開源文生圖模型一夜易主! 智東西8月2日報道,昨日晚間,開源文生圖模型霸主Stable Diffusio...
開放域檢測新SOTA!中山大學美團出品,開源性能最強
王豪 投稿自 凹非寺量子位 | 公眾號 QbitAI開放域檢測領域,迎來新進展—— 中山大學聯合美團提出新模型OV-DINO,實現開放域檢測開源新SOTA! 比Grounding DINO...
對比學習濫用隱私數據!中科院等發布「多步誤差最小化」方法 | ACM MM2024
新智元報道編輯:LRST 好困 【新智元導讀】研究人員提出了一種新穎的多步誤差最小化(MEM)方法,用于生成多模態不可學習樣本,以保護個人數據不被多模態對比...
Diffusion 反饋強勢助力 CLIP 秒變火眼金睛:北京智源研究院、中科院自動化所聯合推出 DIVA
本文分享論文Diffusion Feedback Helps CLIP See Better,專注于通過自監督學習范式解決CLIP無法區分細粒度視覺細節的問題。 作者:王文軒(中科院自動化所-...
教程上新 | 文生圖、圖生圖、圖像修復三合一神器, HiDiffusion 一鍵啟動教程現已上線!
擴散模型已成為高分辨率圖像合成的主流方法,傳統的擴散模型雖然在圖像合成方面取得了顯著進展,但在擴展到更高分辨率時往往面臨對象重復和計算成本增加的問...
Midjourney新版本上線即爆火!網友已玩瘋:和攝影幾乎沒區別
明敏 發自 凹非寺量子位 | 公眾號 QbitAIMidjourney v6.1剛剛發布立刻爆火! 各種人像大片,一氣呵成。 畫面、光線、人物表情動作……都更加逼近現實。 雕像的...
國產多模態卷上下文長度:原生支持24K圖文輸入輸出,圖像視頻理解對標GPT4V
陳林 投稿自 凹非寺量子位 | 公眾號 QbitAI國產多模態大模型,也開始卷上下文長度。 書生·浦語靈筆(InternLM-XComposer)多模態大模型升級2.5版本—— 原生支...
AI 視頻生成器 Runway 推出新的圖像轉視頻功能
點擊上方藍字關注我們Runway 現在利用其最新的 Gen-3 Alpha 模型支持圖像轉視頻。用戶可以使用任何圖像作為創建視頻的起點。圖像可以單獨使用,也可以與文本...
Meta「分割一切」進化2.0!一鍵跟蹤物體,代碼權重數據集全開源,網友:真正的OpenAI
明敏 發自 凹非寺量子位 | 公眾號 QbitAI又是發布即開源! Meta“分割一切AI”二代SAM2在SIGGRAPH上剛剛亮相。 相較于上一代,它的能力從圖像分割拓展到視頻分...
防不勝防!AI幾米外隔空窺屏,HDMI線把信號泄露到空氣里了
一水 發自 凹非寺量子位 | 公眾號 QbitAI防不勝防!黑客通過顯示器數據線泄露的信號,就能偷窺你的屏幕內容。 具體來說,是HDMI數據線的電磁輻射,會把一些顯...