標簽:圖像
Stable Video 3D震撼登場:單圖生成無死角3D視頻、模型權重開放
機器之心報道 編輯:杜偉3D 生成領域迎來新的「SOTA 級選手」,支持商用和非商用。Stability AI 的大模型家族來了一位新成員。 昨日,Stability AI 繼推出文...
谷歌發(fā)布“Vlogger”模型:單張圖片生成10秒視頻
豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI谷歌發(fā)布了一個新的視頻框架: 只需要一張你的頭像、一段講話錄音,就能得到一個本人栩栩如生的演講視頻。視頻時長可...
Stability AI開源上新:3D生成引入視頻擴散模型,質量一致性up,4090可玩
魚羊 發(fā)自 凹非寺量子位 | 公眾號 QbitAIStable Diffusion背后公司Stability AI又上新了。 這次帶來的是圖生3D方面的新進展: 基于Stable Video Diffusion的S...
可控圖像生成最新綜述!北郵開源20頁249篇文獻,包攬Text-to-Image Diffusion領域各種「條件」
新智元報道編輯:LRS 【新智元導讀】利用文本生成圖片(Text-to-Image, T2I)已經滿足不了人們的需要了,近期研究在T2I模型的基礎上引入了更多類型的條件來生...
大模型能自己優(yōu)化Prompt了,曾經那么火的提示工程要死了嗎?
選自IEEE 機器之心編譯 編輯:Panda人類設計 prompt 的效率其實很低,效果也不如 AI 模型自己優(yōu)化。2022 年底,ChatGPT 上線,同時引爆了一個新的名詞:提示...
蘋果首次披露多模態(tài)大模型!AI 大招什么時候上 iPhone
一直在大模型浪潮有點克制的蘋果,終于不再低調了。在今年的蘋果股東大會上,庫克罕見地談及了生成式 AI。 蘋果 2024 年將在生成式 AI 領域「開辟新天地」。 ...
蘋果終于入局大模型了:300億參數(shù)、MoE 架構,手機要迎來全面的大變革了?
作者 | 李忠良 今天,Apple 公司通過一篇名為《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的研究論文,正式官宣了其在多模...
蘋果公司推出MM1:多模態(tài)大型語言模型的新紀元
點擊上方藍字關注我們“蘋果公司近日宣布了其最新的多模態(tài)大型語言模型(MLLM)——MM1,這一創(chuàng)新產品在多模態(tài)學習和人工智能領域樹立了新的里程碑。MM1通過精心...
蘋果大模型MM1殺入場:300億參數(shù)、多模態(tài)、MoE架構,超半數(shù)作者是華人
機器之心報道 機器之心編輯部蘋果也在搞自己的大型多模態(tài)基礎模型,未來會不會基于該模型推出相應的文生圖產品呢?我們拭目以待。 今年以來,蘋果顯然已經加...
顏水成/程明明新作!Sora核心組件DiT訓練提速10倍,Masked Diffusion Transformer V2開源
新智元報道編輯:LRS 好困 【新智元導讀】Masked Diffusion Transformer V2在ImageNet benchmark 上實現(xiàn)了1.58的FID score的新SoTA,并通過mask modeling表征...
LLM將成歷史?開源bGPT或顛覆深度學習范式:直接模擬二進制,開啟模擬數(shù)字世界新紀元!
新智元報道編輯:LRS 【新智元導讀】新模型bGPT是一個基于字節(jié)的Transformer模型,能夠將不同類型的數(shù)據(jù)納入同一框架之下,可以生成文本、圖像和音頻,還能模...
Midjourney能讓角色保持一致了!網友連夜實測:改變游戲規(guī)則
西風 發(fā)自 凹非寺量子位 | 公眾號 QbitAIMidjourney發(fā)布新功能,網友直呼“不可思議”! 現(xiàn)在你可以讓生成的圖像幾乎保持角色一致,belike: 所有超級英雄長一...
被誤解的「中文版Sora」背后,字節(jié)跳動有哪些技術?
機器之心報道 作者:蛋醬2024 開年,OpenAI 就在生成式 AI 領域扔下了重磅炸彈:Sora。 這幾年,視頻生成領域的技術迭代持續(xù)加速,很多科技公司也公布了相關...
王室修圖何必用PS?Midjourney上新「換臉魔法」,奧特曼一秒COS羅馬將軍
機器之心報道 編輯:蛋醬這兩天,英國王室的 P 圖事件鬧得沸沸揚揚。 3 月 10 日,威廉與凱特的 X 官方賬號分享了一張凱特王妃和 3 個孩子的合影。然而,這張...
基于DiT,支持4K圖像生成,華為諾亞0.6B文生圖模型PixArt-Σ來了
機器之心報道 機器之心編輯部這個模型和 Sora 一樣采用了 DiT 框架。眾所周知,開發(fā)頂級的文生圖(T2I)模型需要大量資源,因此資源有限的個人研究者基本都不...