原標(biāo)題:快手可靈大模型新功能升級-圖生視頻和視頻續(xù)寫
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):1674字
快手可靈大模型的最新升級:開啟視頻創(chuàng)作新篇章
隨著科技的飛速進(jìn)步,視頻創(chuàng)作工具也在不斷演變和升級。近期,快手可靈大模型在6月21日進(jìn)行了重要更新,引入了兩項頗具創(chuàng)新性的功能:圖生視頻和視頻續(xù)寫。這一系列的功能拓展,為視頻創(chuàng)作領(lǐng)域帶來了全新的可能性。
革新功能一覽
快手可靈大模型于6月6日首次推出了“文生視頻”能力,并在快影App中開放了邀測體驗,吸引了約14萬用戶排隊申請。短短半個多月,便迎來了新一輪的重大更新,顯示出快手在技術(shù)研發(fā)上的快速推進(jìn)。
圖生視頻功能
圖生視頻功能的推出,使得用戶可以將任意靜態(tài)圖像轉(zhuǎn)化為5秒鐘的動態(tài)視頻。通過添加不同的文本提示詞,用戶可以控制圖像中物體的,進(jìn)而實現(xiàn)豐富的視覺敘事。例如,用戶可以上傳一幅經(jīng)典的蒙娜麗莎畫像,并通過提示詞讓她戴上墨鏡,甚至與觀眾進(jìn)行眼神交流。這一功能極大地拓展了創(chuàng)作者的表現(xiàn)形式,使得靜態(tài)藝術(shù)作品變得生動起來。
視頻續(xù)寫功能
視頻續(xù)寫功能則為已生成的視頻(包括文生視頻和圖生視頻)帶來了更大的創(chuàng)作空間。用戶只需一鍵續(xù)寫,即可生成約5秒的新內(nèi)容,并通過多次續(xù)寫最終獲得最長約3分鐘的視頻。此功能的亮點(diǎn)在于集成了文本控制機(jī)制,使得用戶能夠為每段視頻續(xù)寫注入個性化的創(chuàng)意。例如,用戶可以設(shè)置視頻場景的變化,從古堡的白天到夜晚的燈光效果,展現(xiàn)出不同的視覺沖擊力。
技術(shù)架構(gòu)的突破
快手可靈大模型采用了先進(jìn)的DiT架構(gòu),并在隱空間編/解碼、時序建模等方面進(jìn)行了升級。這種架構(gòu)使得模型能夠精準(zhǔn)捕捉視頻幀內(nèi)的局部空間特征以及跨幀的時間動態(tài)特征,全面理解和再現(xiàn)視頻中的信息。無論是快速移動的物體,還是復(fù)雜的人物動作,快手可靈都能生成充滿動態(tài)感且高度真實的視頻內(nèi)容。
總結(jié)
快手可靈大模型的最新功能升級為視頻創(chuàng)作領(lǐng)域提供了新的可能性。圖生視頻和視頻續(xù)寫功能不僅提升了模型的創(chuàng)作能力,還擴(kuò)展了其在視頻生成領(lǐng)域的應(yīng)用范圍。這些創(chuàng)新功能將為用戶帶來更多的創(chuàng)作度和創(chuàng)意空間,開啟視頻創(chuàng)作的新紀(jì)元。
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點(diǎn)和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。