標(biāo)簽:圖像

揭秘OpenAI Sora的關(guān)鍵要素:時(shí)空補(bǔ)丁

點(diǎn)擊上方藍(lán)字關(guān)注我們“OpenAI Sora 創(chuàng)新運(yùn)用時(shí)空補(bǔ)丁,將靜態(tài)圖像轉(zhuǎn)化為逼真動(dòng)態(tài)視頻。該技術(shù)革新了視頻生成領(lǐng)域,通過多樣化的訓(xùn)練數(shù)據(jù)和靈活的建模方法,So...
閱讀原文

OpenAI Sora視頻生成模型技術(shù)報(bào)告中英全文

來源:專知 OpenAI 探索了視頻數(shù)據(jù)生成模型的大規(guī)模訓(xùn)練。具體來說,研究人員在可變持續(xù)時(shí)間、分辨率和寬高比的視頻和圖像上聯(lián)合訓(xùn)練了一個(gè)文本條件擴(kuò)散模型...
閱讀原文

OpenAI超級(jí)視頻模型Sora技術(shù)報(bào)告解讀,虛擬世界涌現(xiàn)了

夕小瑤科技說 分享來源 | 新智元 昨天白天,「現(xiàn)實(shí)不存在了」開始全網(wǎng)刷屏。 「我們這么快就步入下一個(gè)時(shí)代了?Sora簡直太炸裂了」。 「這就是電影制作的未來...
閱讀原文

真·降維打擊,Sora與Runway、Pika的對(duì)比來了,震撼效果背后是物理引擎模擬現(xiàn)實(shí)世界

機(jī)器之心報(bào)道 編輯:杜偉以后的視頻生成領(lǐng)域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 發(fā)布的首個(gè)文本生成視頻模型 Sora 引爆了社區(qū),其生...
閱讀原文

Sora涌現(xiàn),OpenAI又一次暴力美學(xué)的勝利|甲子光年

將 Scaling Law 進(jìn)行到底。作者|趙健?? 年前的 1 月 27 日,「甲子光年」參加了一場 AI 生成視頻主題的沙龍,會(huì)上有一個(gè)有趣的互動(dòng):AI 視頻生成多快迎來 “M...
閱讀原文

一錘降維!解密OpenAI超級(jí)視頻模型Sora技術(shù)報(bào)告,虛擬世界涌現(xiàn)了

新智元報(bào)道編輯:編輯部 【新智元導(dǎo)讀】OpenAI首個(gè)AI視頻模型Sora橫空出世,再次創(chuàng)造歷史。這個(gè)堪稱「世界模型」的技術(shù)報(bào)告也在今天發(fā)布了,不過依然沒有公開...
閱讀原文

文生圖新SOTA!Pika北大斯坦福聯(lián)合推出RPG,多模態(tài)助力解決文生圖兩大難題

新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】近日,北大、斯坦福、以及Pika Labs發(fā)布了新的開源文生圖框架,利用多模態(tài)LLM的能力成功解決文生圖兩大難題,表現(xiàn)超越SD...
閱讀原文

生成速度快SDXL一倍,9GB GPU也能運(yùn)行,Stable Cascade來搞性價(jià)比了

機(jī)器之心報(bào)道 編輯:大盤雞硬件要求越來越低,生成速度越來越快。Stability AI 作為文本到圖像的「元老」,不僅在引領(lǐng)該領(lǐng)域的潮流方向,也在模型質(zhì)量上一次...
閱讀原文

PRO | AR 賽道距離它的 ChatGPT 時(shí)刻只差一個(gè) LMM 了嗎?

2023年,幾乎 AI 的每個(gè)領(lǐng)域都在以前所未有的速度進(jìn)化,同時(shí),AI也在不斷地推動(dòng)著具身智能、自動(dòng)駕駛等關(guān)鍵賽道的技術(shù)邊界。 多模態(tài)趨勢下,Transformer 作為...
閱讀原文

ChatGPT 變懶最新解釋!或和系統(tǒng)Prompt太長有關(guān)

夕小瑤科技說 原創(chuàng)作者 | 王二狗大家好我是二狗。 ChatGPT變懶這件事又有了最新解釋了。 這兩天,推特用戶Dylan Patel發(fā)文表示: 你想知道為什么 ChatGPT 和 ...
閱讀原文

計(jì)算機(jī)視覺算法,難以落地?zé)o人機(jī)航拍應(yīng)用,why?

(謹(jǐn)以此文,獻(xiàn)給那些涉及 AI 需求的產(chǎn)品經(jīng)理,領(lǐng)導(dǎo),以及某些不稱職的算法工程師們) 今天來說點(diǎn)真話,不吐不快。 在ChatGPT 大模型到來之前,人工智能發(fā)展...
閱讀原文

10X增強(qiáng)!ChatGPT退位,Bard

整理|凌敏、核子可樂Bard 功能增強(qiáng) 10 倍2 月 5 日,Priyank Ahuja 在 X(原 Twitter)上發(fā)帖稱,谷歌 Bard 迎來重大升級(jí),功能增強(qiáng) 10 倍,并表示“告別 Cha...
閱讀原文

胡淵鳴創(chuàng)業(yè)公司Meshy產(chǎn)品升級(jí):文本轉(zhuǎn)3D,25秒就能出預(yù)覽

機(jī)器之心報(bào)道 編輯:張倩Meshy-2 的文本轉(zhuǎn) 3D、圖像轉(zhuǎn) 3D、文本到紋理效果均有所提升。剛剛,胡淵鳴創(chuàng)業(yè)公司 Meshy 官宣了他們的第二代產(chǎn)品 ——Meshy-2。Meshy...
閱讀原文

如何提升多模態(tài)效果?從這26個(gè)主流大模型來看看

智猩猩和智東西發(fā)起主辦的2024中國生成式AI大會(huì)將于4月18-19日在北京舉辦。主會(huì)場將進(jìn)行開幕式、大模型專場、AI基礎(chǔ)軟件專場和AIGC應(yīng)用專場;分會(huì)場將進(jìn)行具...
閱讀原文

再也不用羨慕修仙永生了,我已經(jīng)“做到”了

? 點(diǎn)擊上方卡片關(guān)注我,文末有彩蛋驚喜哦!作者 | 李忠良大模型技術(shù)的突破讓生成式人工智能變得無處不在,從文本到圖像再到視頻,它們讓我們的世界變得更加多...
閱讀原文
1272829303148