快手可靈大模型的最新升級:開啟視頻創作新篇章
隨著科技的飛速進步,視頻創作工具也在不斷演變和升級。近期,快手可靈大模型在6月21日進行了重要更新,引入了兩項頗具創新性的功能:圖生視頻和視頻續寫。這一系列的功能拓展,為視頻創作領域帶來了全新的可能性。
革新功能一覽
快手可靈大模型于6月6日首次推出了“文生視頻”能力,并在快影App中開放了邀測體驗,吸引了約14萬用戶排隊申請。短短半個多月,便迎來了新一輪的重大更新,顯示出快手在技術研發上的快速推進。
圖生視頻功能
圖生視頻功能的推出,使得用戶可以將任意靜態圖像轉化為5秒鐘的動態視頻。通過添加不同的文本提示詞,用戶可以控制圖像中物體的,進而實現豐富的視覺敘事。例如,用戶可以上傳一幅經典的蒙娜麗莎畫像,并通過提示詞讓她戴上墨鏡,甚至與觀眾進行眼神交流。這一功能極大地拓展了創作者的表現形式,使得靜態藝術作品變得生動起來。
視頻續寫功能
視頻續寫功能則為已生成的視頻(包括文生視頻和圖生視頻)帶來了更大的創作空間。用戶只需一鍵續寫,即可生成約5秒的新內容,并通過多次續寫最終獲得最長約3分鐘的視頻。此功能的亮點在于集成了文本控制機制,使得用戶能夠為每段視頻續寫注入個性化的創意。例如,用戶可以設置視頻場景的變化,從古堡的白天到夜晚的燈光效果,展現出不同的視覺沖擊力。
技術架構的突破
快手可靈大模型采用了先進的DiT架構,并在隱空間編/解碼、時序建模等方面進行了升級。這種架構使得模型能夠精準捕捉視頻幀內的局部空間特征以及跨幀的時間動態特征,全面理解和再現視頻中的信息。無論是快速移動的物體,還是復雜的人物動作,快手可靈都能生成充滿動態感且高度真實的視頻內容。
總結
快手可靈大模型的最新功能升級為視頻創作領域提供了新的可能性。圖生視頻和視頻續寫功能不僅提升了模型的創作能力,還擴展了其在視頻生成領域的應用范圍。這些創新功能將為用戶帶來更多的創作度和創意空間,開啟視頻創作的新紀元。
聯系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內容的前沿信息與技術分享。我們提供AI生成藝術、文本、音樂、視頻等領域的最新動態與應用案例。每日新聞速遞、技術解讀、行業分析、專家觀點和創意展示。期待與您一起探索AI的無限潛力。歡迎關注并分享您的AI作品或寶貴意見。