AIGC動態歡迎閱讀
原標題:短劇時代即將來臨?AI自動生成劇本和多場景長視頻
關鍵字:視頻,模型,,文本,背景
文章來源:大數據文摘
內容字數:4432字
內容摘要:
大數據文摘授權轉載自將門創投
作者:HiDream.ai
近年來隨著擴散模型(diffusion models)的進步和發展,給定文本提示進行高質量視頻生成技術有著顯著的提升。這些技術方案大多針對已有的二維圖像擴散模型進行拓展,將圖像二維神經網絡修正為視頻三維神經網絡,并基于擴散概率模型進行視頻幀序列的去噪,完成視頻生成。然而,這些現有方法依然圍繞著單個場景的視頻生成,對于多場景視頻生成并未考慮,并且生成的視頻長度也僅為2秒到4秒。
基于這樣的問題,來自HiDream.ai公司的算法研究人員提出利用大語言模型針對輸入的文本提示進行多場景描述的拓展,保證不同之間的邏輯性和場景中前景背景描述的一致性。其后,針對大語言模型提供的每一個所對應的前景背景描述,以及動作描述,利用視頻擴散模型生成具有內容一致的視頻片段,從而構建一個多場景的長視頻。論文鏈接:
https://arxiv.org/abs/2401.01256
項目主頁:
https://videodrafter.github.io/
視頻鏈接:
https://www.youtube.com/watch?v=_aIrobr
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...