標簽:圖像

揭秘OpenAI Sora的關鍵要素:時空補丁

點擊上方藍字關注我們“OpenAI Sora 創新運用時空補丁,將靜態圖像轉化為逼真動態視頻。該技術革新了視頻生成領域,通過多樣化的訓練數據和靈活的建模方法,So...
閱讀原文

OpenAI Sora視頻生成模型技術報告中英全文

來源:專知 OpenAI 探索了視頻數據生成模型的大規模訓練。具體來說,研究人員在可變持續時間、分辨率和寬高比的視頻和圖像上聯合訓練了一個文本條件擴散模型...
閱讀原文

OpenAI超級視頻模型Sora技術報告解讀,虛擬世界涌現了

夕小瑤科技說 分享來源 | 新智元 昨天白天,「現實不存在了」開始全網刷屏。 「我們這么快就步入下一個時代了?Sora簡直太炸裂了」。 「這就是電影制作的未來...
閱讀原文

真·降維打擊,Sora與Runway、Pika的對比來了,震撼效果背后是物理引擎模擬現實世界

機器之心報道 編輯:杜偉以后的視頻生成領域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 發布的首個文本生成視頻模型 Sora 引爆了社區,其生...
閱讀原文

Sora涌現,OpenAI又一次暴力美學的勝利|甲子光年

將 Scaling Law 進行到底。作者|趙健?? 年前的 1 月 27 日,「甲子光年」參加了一場 AI 生成視頻主題的沙龍,會上有一個有趣的互動:AI 視頻生成多快迎來 “M...
閱讀原文

一錘降維!解密OpenAI超級視頻模型Sora技術報告,虛擬世界涌現了

新智元報道編輯:編輯部 【新智元導讀】OpenAI首個AI視頻模型Sora橫空出世,再次創造歷史。這個堪稱「世界模型」的技術報告也在今天發布了,不過依然沒有公開...
閱讀原文

文生圖新SOTA!Pika北大斯坦福聯合推出RPG,多模態助力解決文生圖兩大難題

新智元報道編輯:alan 【新智元導讀】近日,北大、斯坦福、以及Pika Labs發布了新的開源文生圖框架,利用多模態LLM的能力成功解決文生圖兩大難題,表現超越SD...
閱讀原文

生成速度快SDXL一倍,9GB GPU也能運行,Stable Cascade來搞性價比了

機器之心報道 編輯:大盤雞硬件要求越來越低,生成速度越來越快。Stability AI 作為文本到圖像的「元老」,不僅在引領該領域的潮流方向,也在模型質量上一次...
閱讀原文

PRO | AR 賽道距離它的 ChatGPT 時刻只差一個 LMM 了嗎?

2023年,幾乎 AI 的每個領域都在以前所未有的速度進化,同時,AI也在不斷地推動著具身智能、自動駕駛等關鍵賽道的技術邊界。 多模態趨勢下,Transformer 作為...
閱讀原文

ChatGPT 變懶最新解釋!或和系統Prompt太長有關

夕小瑤科技說 原創作者 | 王二狗大家好我是二狗。 ChatGPT變懶這件事又有了最新解釋了。 這兩天,推特用戶Dylan Patel發文表示: 你想知道為什么 ChatGPT 和 ...
閱讀原文

計算機視覺算法,難以落地無人機航拍應用,why?

(謹以此文,獻給那些涉及 AI 需求的產品經理,領導,以及某些不稱職的算法工程師們) 今天來說點真話,不吐不快。 在ChatGPT 大模型到來之前,人工智能發展...
閱讀原文

10X增強!ChatGPT退位,Bard

整理|凌敏、核子可樂Bard 功能增強 10 倍2 月 5 日,Priyank Ahuja 在 X(原 Twitter)上發帖稱,谷歌 Bard 迎來重大升級,功能增強 10 倍,并表示“告別 Cha...
閱讀原文

胡淵鳴創業公司Meshy產品升級:文本轉3D,25秒就能出預覽

機器之心報道 編輯:張倩Meshy-2 的文本轉 3D、圖像轉 3D、文本到紋理效果均有所提升。剛剛,胡淵鳴創業公司 Meshy 官宣了他們的第二代產品 ——Meshy-2。Meshy...
閱讀原文

如何提升多模態效果?從這26個主流大模型來看看

智猩猩和智東西發起主辦的2024中國生成式AI大會將于4月18-19日在北京舉辦。主會場將進行開幕式、大模型專場、AI基礎軟件專場和AIGC應用專場;分會場將進行具...
閱讀原文

再也不用羨慕修仙永生了,我已經“做到”了

? 點擊上方卡片關注我,文末有彩蛋驚喜哦!作者 | 李忠良大模型技術的突破讓生成式人工智能變得無處不在,從文本到圖像再到視頻,它們讓我們的世界變得更加多...
閱讀原文
1272829303148