過去一年我開發 AI 視頻編輯器的收獲

AIGC動態1年前 (2024)發布 AI前線

過去一年我開發 AI 視頻編輯器的收獲

AIGC動態歡迎閱讀

原標題：過去一年我開發 AI 視頻編輯器的收獲
關鍵字：元宇宙,模型,視頻,小米,提示
文章來源：AI前線
內容字數：0字

內容摘要：

作者 | Kirk Kaiser 譯者 | Sambodhi 策劃 | 褚杏娟
去年，我在一個新崗位上僅工作 6 個月就被解雇了。
我離開了一家很棒的公司和老板，去冒險加入一家初創公司，但還沒真正開始，一切就結束了。
我決定以此為契機，探索 LLM（大語言模型）、擴散模型以及越來越多的其他開放模型在視頻領域中的新可能性。
多年前，我曾幫助打造了一個后來成為獨角獸的生成式視頻編輯#Launch_and_Early_years)，并從那時起就有了一些想要實現的想法。
在 2015 年，這些想法大多顯得不切實際，但隨著 LLM 和計算機視覺模型的進步，現在它們已經變得有實現的可能了。GPU 資源緊缺與本地優先、
多模態生成式人工智能
我最初專注于構建一個通過多模態人工智能改進的本地視頻編輯器。它利用計算機視覺檢測、提取和跟蹤視頻中的物體，并結合擴散模型為視頻添加和動畫化新物體。
5 年前，我曾使用 Mask-RCNN 每天制作視頻草稿，嘗試滑板視頻的創作。
這些視頻草稿讓我在沒有任何強烈預期的情況下，探索了人工智能輔助視頻編輯這一媒介。我認為，開發一個工具來繼續探索這項工作將會取得豐碩的成

原文鏈接：過去一年我開發 AI 視頻編輯器的收獲