AIGC動態歡迎閱讀
原標題:谷歌推出視頻生成大型語言模型VideoPoet
關鍵字:視頻,模型,文本,音頻,圖像
文章來源:AI范兒
內容字數:2042字
內容摘要:
點擊上方藍字關注我們“Google推出VideoPoet,一款生成式AI系統,通過文本等輸入創建和編輯視頻。與競爭模型不同,VideoPoet整合多項功能于單一模型,包括文本轉視頻、圖像轉視頻、視頻風格化等。該模型利用多個標記器跨視頻、圖像、音頻和文本進行訓練,可生成可變長度、多樣風格的視頻。Google 推出了 VideoPoet,這是一款新型生成式人工智能系統,能夠通過文本和其他輸入創建和編輯視頻。
據 Google 表示,VideoPoet是一款龐大的語言模型,專為各種視頻生成任務而設計,包括文本轉視頻、圖像轉視頻、視頻風格化、視頻修復與拓展以及視頻轉音頻等。與競爭模型不同,VideoPoet將許多功能集成到一個單一模型中,而不是依賴于為每個任務分別訓練的組件。
VideoPoet使用多個標記器(MAGVIT V2 用于視頻和圖像,SoundStream 用于音頻),以訓練跨視頻、圖像、音頻和文本多模態的自回歸語言模型。一旦模型生成了在某個上下文中有條件的標記,這些標記可以通過標記解碼器轉換回可視化表示。
VideoPoet能夠生成具有可變長度、多種和樣式的視頻,具體取決于文
聯系作者
文章來源:AI范兒
作者微信:AI_Insights
作者簡介:智能未來,始于Prompt!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...