在Sora引爆視頻生成時(shí),Meta開始用Agent自動(dòng)剪視頻了,華人作者主導(dǎo)

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:在Sora引爆視頻生成時(shí),Meta開始用Agent自動(dòng)剪視頻了,華人作者主導(dǎo)
關(guān)鍵字:視頻剪輯,剪輯,智能,視頻,用戶
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):6228字
內(nèi)容摘要:
機(jī)器之心報(bào)道
編輯:杜偉、小舟未來,視頻剪輯可能也會(huì)像視頻生成領(lǐng)域一樣迎來 AI 自動(dòng)化操作的大爆發(fā)。這幾天,AI 視頻領(lǐng)域異常地?zé)狒[,其中 OpenAI 推出的視頻生成大模型 Sora 更是火出了圈。而在視頻剪輯領(lǐng)域,AI 尤其是大模型賦能的 Agent 也開始大顯身手。
隨著自然語言被用來處理與視頻剪輯相關(guān)的任務(wù),用戶可以直接傳達(dá)自己的意圖,從而不需要手動(dòng)操作。但目前來看,大多數(shù)視頻剪輯工具仍然嚴(yán)重依賴手動(dòng)操作,并且往往缺乏定制化的上下文幫助。因此,用戶只能自己處理復(fù)雜的視頻剪輯問題。
關(guān)鍵在于如何設(shè)計(jì)一個(gè)可以充當(dāng)協(xié)作者、并在剪輯過程中不斷協(xié)助用戶的視頻剪輯工具?在本文中,來自多倫多大學(xué)、 Meta(Reality Labs Research)、加州大學(xué)圣迭戈分校的研究者提出利用大語言模型(LLM)的多功能語言能力來進(jìn)行視頻剪輯,并探討了未來的視頻剪輯范式,從而減少與手動(dòng)視頻剪輯過程的阻礙。論文標(biāo)題:LAVE: LLM-Powered Agent Assistance and Language Augmentation for Video Editing
論文地址:https://
原文鏈接:在Sora引爆視頻生成時(shí),Meta開始用Agent自動(dòng)剪視頻了,華人作者主導(dǎo)
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺

粵公網(wǎng)安備 44011502001135號