AIGC動態歡迎閱讀
原標題:AI看視頻自動找“高能時刻”|字節&中科院自動化所@AAAI 2024
關鍵字:字節跳動,原型,階段,視頻,美食
文章來源:量子位
內容字數:5647字
內容摘要:
夢晨 發自 凹非寺量子位 | 公眾號 QbitAI大家看視頻用過“高光時刻”功能嗎?
觀眾可以直接空降到精彩時刻,主播也可以從長時間直播錄像中復盤自己的表現。
字節跳動聯合中科院自動化研究所提出新方法,用AI快速檢測出視頻中的高光片段,對輸入視頻的長度以及期望提取的高光長度都具有極高的靈活性,相關論文已被AAAI 2024收錄。
基于原型學習的基準解決方案連續學習問題在圖像識別領域得到了很好的發展,有效緩解了深度學習模型所面臨的災難性遺忘問題。然而,現有的技術大多適用于圖像域,在視頻域上探索連續學習的相關方法還比較少。分析其中的原因,主要是兩個方面的困境:其一是缺少用于增量學習的視頻數據集以及評測標準;其二是缺少一個適用于視頻域增量學習的基準方法。
面對這一挑戰,字節跳動聯合中科院自動化研究所標注了用于域增量學習的美食視頻數據集LiveFood,并在此基礎上,提出了基于原型學習的基準解決方案:Global Prototype Encoding(GPE)。
GPE克服了現有增量學習方案的諸多弊端,通過在圖像幀級別上的打分,幫助快速檢測出視頻中的高光片段,對輸入視頻的長度以及期望提取的高光
原文鏈接:AI看視頻自動找“高能時刻”|字節&中科院自動化所@AAAI 2024
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...