標(biāo)簽:圖像
Stable Video 3D震撼登場:單圖生成無死角3D視頻、模型權(quán)重開放
機(jī)器之心報(bào)道 編輯:杜偉3D 生成領(lǐng)域迎來新的「SOTA 級選手」,支持商用和非商用。Stability AI 的大模型家族來了一位新成員。 昨日,Stability AI 繼推出文...
谷歌發(fā)布“Vlogger”模型:單張圖片生成10秒視頻
豐色 發(fā)自 凹非寺量子位 | 公眾號 QbitAI谷歌發(fā)布了一個(gè)新的視頻框架: 只需要一張你的頭像、一段講話錄音,就能得到一個(gè)本人栩栩如生的演講視頻。視頻時(shí)長可...
Stability AI開源上新:3D生成引入視頻擴(kuò)散模型,質(zhì)量一致性up,4090可玩
魚羊 發(fā)自 凹非寺量子位 | 公眾號 QbitAIStable Diffusion背后公司Stability AI又上新了。 這次帶來的是圖生3D方面的新進(jìn)展: 基于Stable Video Diffusion的S...
可控圖像生成最新綜述!北郵開源20頁249篇文獻(xiàn),包攬Text-to-Image Diffusion領(lǐng)域各種「條件」
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】利用文本生成圖片(Text-to-Image, T2I)已經(jīng)滿足不了人們的需要了,近期研究在T2I模型的基礎(chǔ)上引入了更多類型的條件來生...
大模型能自己優(yōu)化Prompt了,曾經(jīng)那么火的提示工程要死了嗎?
選自IEEE 機(jī)器之心編譯 編輯:Panda人類設(shè)計(jì) prompt 的效率其實(shí)很低,效果也不如 AI 模型自己優(yōu)化。2022 年底,ChatGPT 上線,同時(shí)引爆了一個(gè)新的名詞:提示...
蘋果首次披露多模態(tài)大模型!AI 大招什么時(shí)候上 iPhone
一直在大模型浪潮有點(diǎn)克制的蘋果,終于不再低調(diào)了。在今年的蘋果股東大會(huì)上,庫克罕見地談及了生成式 AI。 蘋果 2024 年將在生成式 AI 領(lǐng)域「開辟新天地」。 ...
蘋果終于入局大模型了:300億參數(shù)、MoE 架構(gòu),手機(jī)要迎來全面的大變革了?
作者 | 李忠良 今天,Apple 公司通過一篇名為《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的研究論文,正式官宣了其在多模...
蘋果公司推出MM1:多模態(tài)大型語言模型的新紀(jì)元
點(diǎn)擊上方藍(lán)字關(guān)注我們“蘋果公司近日宣布了其最新的多模態(tài)大型語言模型(MLLM)——MM1,這一創(chuàng)新產(chǎn)品在多模態(tài)學(xué)習(xí)和人工智能領(lǐng)域樹立了新的里程碑。MM1通過精心...
蘋果大模型MM1殺入場:300億參數(shù)、多模態(tài)、MoE架構(gòu),超半數(shù)作者是華人
機(jī)器之心報(bào)道 機(jī)器之心編輯部蘋果也在搞自己的大型多模態(tài)基礎(chǔ)模型,未來會(huì)不會(huì)基于該模型推出相應(yīng)的文生圖產(chǎn)品呢?我們拭目以待。 今年以來,蘋果顯然已經(jīng)加...
顏水成/程明明新作!Sora核心組件DiT訓(xùn)練提速10倍,Masked Diffusion Transformer V2開源
新智元報(bào)道編輯:LRS 好困 【新智元導(dǎo)讀】Masked Diffusion Transformer V2在ImageNet benchmark 上實(shí)現(xiàn)了1.58的FID score的新SoTA,并通過mask modeling表征...
LLM將成歷史?開源bGPT或顛覆深度學(xué)習(xí)范式:直接模擬二進(jìn)制,開啟模擬數(shù)字世界新紀(jì)元!
新智元報(bào)道編輯:LRS 【新智元導(dǎo)讀】新模型bGPT是一個(gè)基于字節(jié)的Transformer模型,能夠?qū)⒉煌愋偷臄?shù)據(jù)納入同一框架之下,可以生成文本、圖像和音頻,還能模...
Midjourney能讓角色保持一致了!網(wǎng)友連夜實(shí)測:改變游戲規(guī)則
西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAIMidjourney發(fā)布新功能,網(wǎng)友直呼“不可思議”! 現(xiàn)在你可以讓生成的圖像幾乎保持角色一致,belike: 所有超級英雄長一...
被誤解的「中文版Sora」背后,字節(jié)跳動(dòng)有哪些技術(shù)?
機(jī)器之心報(bào)道 作者:蛋醬2024 開年,OpenAI 就在生成式 AI 領(lǐng)域扔下了重磅炸彈:Sora。 這幾年,視頻生成領(lǐng)域的技術(shù)迭代持續(xù)加速,很多科技公司也公布了相關(guān)...
王室修圖何必用PS?Midjourney上新「換臉魔法」,奧特曼一秒COS羅馬將軍
機(jī)器之心報(bào)道 編輯:蛋醬這兩天,英國王室的 P 圖事件鬧得沸沸揚(yáng)揚(yáng)。 3 月 10 日,威廉與凱特的 X 官方賬號分享了一張凱特王妃和 3 個(gè)孩子的合影。然而,這張...
基于DiT,支持4K圖像生成,華為諾亞0.6B文生圖模型PixArt-Σ來了
機(jī)器之心報(bào)道 機(jī)器之心編輯部這個(gè)模型和 Sora 一樣采用了 DiT 框架。眾所周知,開發(fā)頂級的文生圖(T2I)模型需要大量資源,因此資源有限的個(gè)人研究者基本都不...