AIGC動態歡迎閱讀
原標題:谷歌發布新大語言模型:零樣本生成10秒視頻達SOTA!網友:壓力給到Runway/Pika
關鍵字:視頻,模型,畫面,動作,文本
文章來源:量子位
內容字數:3202字
內容摘要:
明敏 發自 凹非寺量子位 | 公眾號 QbitAI你敢信?大熊貓都會打牌了!
看這毛茸茸的腦袋、抓牌的動作……
而這其實都是AI生成的,還是零樣本那種。
這就是谷歌最新大語言模型VideoPoet。
它不僅沒有用視頻領域常用的擴散模型,還零樣本實現了SOTA。相較于此前一些模型,畫面更加穩定、動作更加逼真,清晰度也直線up。
和Bard再合作一下,輕松搞定1分鐘長的視頻小片,從腳本到畫面全部不用人類插手。
這效果,讓網友們直呼:視頻生成進化速度也太快了吧。
不少人都表示想玩!
有人還說,VideoPoet效果這么好,看來Runway和Pika要加速了!
畫面逼真動作穩定具體來看VideoPoet的能力非常全面。包括:
文本-視頻
圖像-視頻
視頻編輯
風格化處理
畫面補充
文本到視頻任務,視頻輸出長度可調整,而且可以基于文本內容應用一系列動作和風格。
圖像到視頻任務,則能讓靜態圖片動起來。比如一些世界名畫和照片,都可生成視頻。
同時也能調整視頻風格,需要額外輸入一些文本,然后模型會預測視頻的光照和深度信息。
比如輸入“鐵獅子在熔爐的火光中咆哮”,原本無厘頭的太陽花獅子就變得兇猛威嚴起來
原文鏈接:谷歌發布新大語言模型:零樣本生成10秒視頻達SOTA!網友:壓力給到Runway/Pika
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...