新國(guó)立祭出視頻生成“無(wú)限寶石“:2300幀僅需5分鐘,提速100倍
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:新國(guó)立祭出視頻生成“無(wú)限寶石“:2300幀僅需5分鐘,提速100倍
關(guān)鍵字:視頻,上下文,片段,模塊,模型
文章來(lái)源:夕小瑤科技說(shuō)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夕小瑤科技說(shuō) 原創(chuàng)作者 | Axe_越天下武功唯快不破—— 火云邪神
前一段時(shí)間,想必大家都有被各種文生視頻給刷屏,但當(dāng)看完之后,不知道大家是否都有一種意猶未盡的感覺(jué):“這也太短了吧,我還沒(méi)看夠呢”。受限于機(jī)器資源與生成效率,目前大部分文生視頻確實(shí)只能做到幾秒,就更不用說(shuō)像滅霸的“現(xiàn)實(shí)”無(wú)限寶石一樣,言出法隨,即可幻化出永久的虛擬現(xiàn)實(shí)場(chǎng)景。
但就在最近,來(lái)自新加坡國(guó)立大學(xué)的團(tuán)隊(duì)推出了他們的新作“Video-Infinity”(無(wú)限視頻),呈百倍數(shù)量級(jí)地提高了視頻生成的效率,或許有一天,根據(jù)一段話就能生成一整部電影,真的可以成為現(xiàn)實(shí)?
論文標(biāo)題:Video-Infinity: Distributed Long Video Generation
論文鏈接:https://arxiv.org/pdf/2406.16260
文生視頻隨著數(shù)據(jù)驅(qū)動(dòng)的生成模型的興起,人們?cè)跀?shù)字系統(tǒng)中復(fù)制現(xiàn)實(shí)世界動(dòng)態(tài)的能力得到了顯著提升。這些模型能夠創(chuàng)造出高度逼真的圖像和視頻,與現(xiàn)實(shí)難以區(qū)分。然而,盡管這些生成模型在圖像合成領(lǐng)域取得了巨大成功,它們?cè)谝曨l生成方面的表現(xiàn)卻常常受限于生成的視頻片段過(guò)短,大多數(shù)模型僅能生成
原文鏈接:新國(guó)立祭出視頻生成“無(wú)限寶石“:2300幀僅需5分鐘,提速100倍
聯(lián)系作者
文章來(lái)源:夕小瑤科技說(shuō)
作者微信:xixiaoyaoQAQ
作者簡(jiǎn)介:專(zhuān)業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬(wàn)AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來(lái)自清北、國(guó)內(nèi)外頂級(jí)AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺(jué)和洞察深度。商務(wù)合作:zym5189