谷歌發(fā)布視頻生成模型 VideoPoet,AI 連剪輯師的工作也承包了
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:谷歌發(fā)布視頻生成模型 VideoPoet,AI 連剪輯師的工作也承包了
關(guān)鍵字:視頻,模型,內(nèi)容,任務(wù),畫面
文章來源:AI科技評論
內(nèi)容字?jǐn)?shù):5176字
內(nèi)容摘要:
VideoPoet 可實(shí)現(xiàn)單個(gè)大模型完成多種視頻生成任務(wù)。作者 | 黃 楠
編輯 | 陳彩嫻
過去一年,從畫圖、寫詩、代碼到語音等生成式內(nèi)容迎來性增長,在這當(dāng)中,被視為 AIGC 高地之一的視頻生成(Text-to-Video)受數(shù)據(jù)、算力多方影響,技術(shù)門檻更高,需要克服視頻畫面質(zhì)量、畫面連續(xù)性、文本和視頻內(nèi)容等諸多挑戰(zhàn)。
近日,由谷歌推出的全新 AI 視頻生成模型 VideoPoet,該模型是一個(gè) Zero-shot(零樣本)視頻生成模型,可節(jié)省大量數(shù)據(jù)和計(jì)算資源,模型表現(xiàn)上也展示了令人驚喜的畫面效果。
比如在多數(shù)情況下,即便是領(lǐng)先的生成模型在面對或大或小的視頻畫面時(shí),不可避免會(huì)出現(xiàn)明顯的偽影問題。但在 VideoPoet 中,上述問題得到了一定的修復(fù)。
此外,VideoPoet 的優(yōu)勢還在于,可將多種生成功能,比如風(fēng)格轉(zhuǎn)化、音視頻生成、長視頻等集合進(jìn)同一個(gè)語言大模型中來完成多任務(wù),而非單個(gè)任務(wù)訓(xùn)練組件的集成。1VideoPoet:零樣本視頻生成模型據(jù)谷歌官方介紹,VideoPoet 是一個(gè)大語言模型,通過選擇將文本作為輸入,能夠在各種以視頻為中心的輸入和輸出上執(zhí)行多任務(wù)處理
原文鏈接:谷歌發(fā)布視頻生成模型 VideoPoet,AI 連剪輯師的工作也承包了
聯(lián)系作者
文章來源:AI科技評論
作者微信:aitechtalk
作者簡介:雷峰網(wǎng)旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。