標簽：圖像

Stable Video 3D震撼登場：單圖生成無死角3D視頻、模型權重開放

機器之心報道編輯：杜偉3D 生成領域迎來新的「SOTA 級選手」，支持商用和非商用。Stability AI 的大模型家族來了一位新成員。昨日，Stability AI 繼推出文...

閱讀原文

AIGC動態

2年前 (2024)

谷歌發布“Vlogger”模型：單張圖片生成10秒視頻

豐色發自凹非寺量子位 | 公眾號 QbitAI谷歌發布了一個新的視頻框架：只需要一張你的頭像、一段講話錄音，就能得到一個本人栩栩如生的演講視頻。視頻時長可...

閱讀原文

AIGC動態

2年前 (2024)

Stability AI開源上新：3D生成引入視頻擴散模型，質量一致性up，4090可玩

魚羊發自凹非寺量子位 | 公眾號 QbitAIStable Diffusion背后公司Stability AI又上新了。這次帶來的是圖生3D方面的新進展：基于Stable Video Diffusion的S...

閱讀原文

AIGC動態

2年前 (2024)

可控圖像生成最新綜述！北郵開源20頁249篇文獻，包攬Text-to-Image Diffusion領域各種「條件」

新智元報道編輯：LRS 【新智元導讀】利用文本生成圖片（Text-to-Image, T2I）已經滿足不了人們的需要了，近期研究在T2I模型的基礎上引入了更多類型的條件來生...

閱讀原文

AIGC動態

2年前 (2024)

大模型能自己優化Prompt了，曾經那么火的提示工程要死了嗎？

選自IEEE 機器之心編譯編輯：Panda人類設計 prompt 的效率其實很低，效果也不如 AI 模型自己優化。2022 年底，ChatGPT 上線，同時引爆了一個新的名詞：提示...

閱讀原文

AIGC動態

2年前 (2024)

蘋果首次披露多模態大模型！AI 大招什么時候上 iPhone

一直在大模型浪潮有點克制的蘋果，終于不再低調了。在今年的蘋果股東大會上，庫克罕見地談及了生成式 AI。蘋果 2024 年將在生成式 AI 領域「開辟新天地」。 ...

閱讀原文

AIGC動態

2年前 (2024)

蘋果終于入局大模型了：300億參數、MoE 架構，手機要迎來全面的大變革了？

作者 | 李忠良今天，Apple 公司通過一篇名為《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的研究論文，正式官宣了其在多模...

閱讀原文

AIGC動態

2年前 (2024)

蘋果公司推出MM1：多模態大型語言模型的新紀元

點擊上方藍字關注我們“蘋果公司近日宣布了其最新的多模態大型語言模型（MLLM）——MM1，這一創新產品在多模態學習和人工智能領域樹立了新的里程碑。MM1通過精心...

閱讀原文

AIGC動態

2年前 (2024)

蘋果大模型MM1殺入場：300億參數、多模態、MoE架構，超半數作者是華人

機器之心報道機器之心編輯部蘋果也在搞自己的大型多模態基礎模型，未來會不會基于該模型推出相應的文生圖產品呢？我們拭目以待。今年以來，蘋果顯然已經加...

閱讀原文

AIGC動態

2年前 (2024)

顏水成/程明明新作！Sora核心組件DiT訓練提速10倍，Masked Diffusion Transformer V2開源

新智元報道編輯：LRS 好困【新智元導讀】Masked Diffusion Transformer V2在ImageNet benchmark 上實現了1.58的FID score的新SoTA，并通過mask modeling表征...

閱讀原文

AIGC動態

2年前 (2024)

LLM將成歷史？開源bGPT或顛覆深度學習范式：直接模擬二進制，開啟模擬數字世界新紀元！

新智元報道編輯：LRS 【新智元導讀】新模型bGPT是一個基于字節的Transformer模型，能夠將不同類型的數據納入同一框架之下，可以生成文本、圖像和音頻，還能模...

閱讀原文

AIGC動態

2年前 (2024)

Midjourney能讓角色保持一致了！網友連夜實測：改變游戲規則

西風發自凹非寺量子位 | 公眾號 QbitAIMidjourney發布新功能，網友直呼“不可思議”！現在你可以讓生成的圖像幾乎保持角色一致，belike：所有超級英雄長一...

閱讀原文

AIGC動態

2年前 (2024)

被誤解的「中文版Sora」背后，字節跳動有哪些技術？

機器之心報道作者：蛋醬2024 開年，OpenAI 就在生成式 AI 領域扔下了重磅炸彈：Sora。這幾年，視頻生成領域的技術迭代持續加速，很多科技公司也公布了相關...

閱讀原文

AIGC動態

2年前 (2024)

王室修圖何必用PS？Midjourney上新「換臉魔法」，奧特曼一秒COS羅馬將軍

機器之心報道編輯：蛋醬這兩天，英國王室的 P 圖事件鬧得沸沸揚揚。 3 月 10 日，威廉與凱特的 X 官方賬號分享了一張凱特王妃和 3 個孩子的合影。然而，這張...

閱讀原文

AIGC動態

2年前 (2024)

基于DiT，支持4K圖像生成，華為諾亞0.6B文生圖模型PixArt-Σ來了

機器之心報道機器之心編輯部這個模型和 Sora 一樣采用了 DiT 框架。眾所周知，開發頂級的文生圖（T2I）模型需要大量資源，因此資源有限的個人研究者基本都不...

閱讀原文

AIGC動態

2年前 (2024)

1…23 242526 27…48