AIGC動態歡迎閱讀
內容摘要:
作者 | Kirk Kaiser 譯者 | Sambodhi 策劃 | 褚杏娟
去年,我在一個新崗位上僅工作 6 個月就被解雇了。
我離開了一家很棒的公司和老板,去冒險加入一家初創公司,但還沒真正開始,一切就結束了。
我決定以此為契機,探索 LLM(大語言模型)、擴散模型以及越來越多的其他開放模型在視頻領域中的新可能性。
多年前,我曾幫助打造了一個后來成為獨角獸的生成式視頻編輯#Launch_and_Early_years),并從那時起就有了一些想要實現的想法。
在 2015 年,這些想法大多顯得不切實際,但隨著 LLM 和計算機視覺模型的進步,現在它們已經變得有實現的可能了。GPU 資源緊缺與本地優先、
多模態生成式人工智能
我最初專注于構建一個通過多模態人工智能改進的本地視頻編輯器。它利用計算機視覺檢測、提取和跟蹤視頻中的物體,并結合擴散模型為視頻添加和動畫化新物體。
5 年前,我曾使用 Mask-RCNN 每天制作視頻草稿,嘗試滑板視頻的創作。
這些視頻草稿讓我在沒有任何強烈預期的情況下,探索了人工智能輔助視頻編輯這一媒介。我認為,開發一個工具來繼續探索這項工作將會取得豐碩的成
原文鏈接:過去一年我開發 AI 視頻編輯器的收獲
聯系作者
文章來源:AI前線
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...